Adobe AnalyticsWebtrekk都是数据分析领域的巨擘,一个是美国市场第一,一个欧洲市场第一,都能提供世界一流的数字分析解决方案。我很有幸能有机会深入了解并应用这两种解决方案,同时也深感数字分析领域的发展永远不缺概念,缺的是应用场景和价值提炼。本文将对这两种解决方案做深入剖析和对比。由于文章实在太长,我分为两部分,此文为下篇。上篇请点击《Adobe Analytics和Webtrekk数字分析解决方案剖析和对比(上)》

三、严谨和科学的数据精神

(一) 数据挖掘算法

数据挖掘和网站分析是数据分析的两个不同领域,数据挖掘侧重于通过模型从海量数据中发现和挖掘未知知识,网站分析通常通过细分、趋势和转化进行价值提取。在之前我们的应用中,我们一直想将两种数据分析方法结合,并探索网站数据挖掘的相关方法;现在,这两种解决方案已经开始将数据挖掘的算法植入系统,并在分析系统中提供了数据挖掘洞察。

Adobe Analytics

Adobe Analytics的数据挖掘应用体现在Anomaly Detection(异常检测)报表,该报表的作用是通过对选定的数据集、时间进行数据运算,找到数据波动的最大值和最小值,当数据实际值超过该范围时形成预警。

Anomaly Detection本质上使用的是时间序列算法,核心是:

  • Holt Winters Multiplicative (Triple Exponential Smoothing)——霍尔特温特斯乘法(三重指数平滑法)
  • Holt Winters Additive (Triple Exponential Smoothing)——霍尔特温特斯加法(三重指数平滑法)
  • Holts Trend Corrected (Double Exponential Smoothing)——Holts趋势校正(双指数平滑法)

这三种算法实际上共同组成了温特斯季节指数平滑模型,其基本思想是把具体线性趋势、季节变动和随机变动的时间序列进行分解研究,并与指数平滑法相结合,分别对长期趋势(Ut)、趋势的增量(bt)和季节变动(Ft)做出估计,与指数平滑法结合起来的预测方法,可以同时处理趋势和季节性变化,并能将随机波动的影响适当地过滤掉,然后建立预测模型,因此,特别适用于包含趋势和季节变化的时间序列的预测问题。

但这个应用目前存在两个问题:

  • Anomaly Detection只能提供截止到昨天的数据检测报告。异常监测的本质不是告诉用户昨天发生了什么,而是当前发生了哪些异常,具体如何异常;
  • 异常检测的作用仅仅局限于SiteCatalyst查看,如果能提供类似于邮件触发、短信或其他类型的触发提示,效果必然提升很多;

关于该功能的详细介绍,请查看《统计学在点击流数据中的应用范例——Adobe Analytics异常检测》

Webtrekk

Webtrekk的数据挖掘算法的核心应用是关联分析,该模型可以应用到页面、站内外搜索词、产品、广告渠道。跟Adobe Analytics的异常检测的现成报表不同,Webtrekk的关联模型报表需要进行简单配置才能查看。通常我们在用数据挖掘工具做数据挖掘时会选择数据源、数据预处理、算法本身需要配置最低支持度、最低置信度和最大前项数等,同样在Webtrekk的关联分析配置中也需要进行配置:

  • 关联分析的算法支持交叉销售算法和向上销售算法两种;
  • 数据集都是采用Raw Data,时间最大只能选择一天;
  • 分析规则上支持不同级别的页面、渠道、产品、广告、站内外搜索词的关联,即可以生成页面关联报表、站内外搜索词报表、广告渠道报表、产品报表;
  • 支持高级配置功能。支持最小频繁度;选择向上销售时会需要确认向上销售的数据集时间;还支持网站分析里面的细分功能,比如我就需要看某个页面的关联效果,只需要过滤该页面即可。

webtrekk关联分析
webtrekk-渠道关联分析

Webtrekk的关联模型应用的范围非常广,它可以提供以下的数据价值洞察:

 用户搜索了站内A关键词之后通常会优化搜索哪个关键词?
 用户在看了A页面之后,通常还会看哪个页面?
 用户买了A产品之后,还会一起买哪个产品?下次又会买哪个产品?
 用户从A渠道进入网站之后,通常还会从哪个渠道再次进入?

实际上在所有的数据挖掘类算法中,规则提取类是最受业务应用关注的算法,原因是提取后的规则可以直接指导他们如何进行业务实践,因此实用性最强(所谓的规则提取类算法包括关联、回归、决策树等以直接目标为分析导向,提取能实现目标规则的算法,如购买A的用户下一次通常会购买B)。

尽管Webtrekk的这个算法很好,但问题在于数据集时间太短。通常情况下,我们会选择合适的样本量,数据太大意味着数据浪费,数据太小不能说明问题。一天的数据量有点小,很可能会有一些偶然性因素出现在结果中,如果能扩大到1周甚至是1个月的数据效果会更好。当然,更大的数据量意味着更多的数据处理需求和更长的时间,这个需要进行取舍。

(二) 更科学的数据洞察开始

有经验的数据分析师,在拿到数据的第一时间并不是开始进行数据分析和挖掘工作,而是先要看数据。

什么是看数据?

看数据就是对目前的整体样本进行数据评估以确认该数据需要如何进行下一步预处理(完整的数据分析流程包括需求处理、数据处理、专项分析、部署优化和项目总结,具体请见《如何建立落地型数据分析(挖掘)流程?》)。

如何看数据?

看数据就是要看数据的整体分布、数据趋势、数据极值、平均值、标准差和方差等,以此来判断该数据是否稳定并且判断是否存在异常值。对比Adobe Analytics和Webtrekk,Adobe Analytics仅在报表底部提供了数据汇总功能,相比之下,Webtrekk做的可圈可点:

webtrekk-科学报表

  • 提供了更多的整体数据查看选项。包括平均值、最大值、最小值、汇总、页面内数据汇总等,通过这些指标,可以一眼看到所选择的报表中数据的分布情况,结合顶部的数据趋势等图形可以有效判断数据分布。
  • 提供了针对每天数据的提示功能。包括高亮或柱形图,日常我们在Excel中做数据汇总时,这种表示方法是基本的标注数据关注度的方法,如果把这个表格做成Dashboard直接发送给老板,老板会更容易在一堆数据中发现重点标注的数据;另外我们在自己做数据时也会非常容易发现数据的异常值。

四、功能丰富性和服务价值

(一) 功能丰富性

两种解决方案的功能无疑都非常丰富,以下列出日常关注的重点功能对比,具体功能点的解释请见《商用网站分析工具选择指南——功能篇》

功能点

Adobe Analytics

Webtrekk

功能分类

功能点

功能描述

基本功能

基本维度

跟踪站内外广告、页面、搜索词、订单等

无搜索词模块,通过自定义变量代码实施可实现

默认全部监测,通过后台监测设置参数实现

基本指标

流量类、订单类等

无新访客占比,通过代码实施可实现。

默认全部提供

APP跟踪

跟踪Android、IOS、Win的APP应用

支持SDK监测,且提供了APP特有的指标

支持SDK监测

Wap跟踪

跟踪Wap网站,包括不支持JS的网站

支持

支持

用户权限管理

通过权限控制为不同用户分配不同的内容查看权限

支持,但一个数据包内无法支持按数据内容进行用户权限分配(只支持按报表包框架选择)

支持,且可以在一个数据包内按数据内容分配用户权限

热力图

包括覆盖图和点击热力图

支持,但点击热力图需要单独代码实施才能使用,较为复杂

支持,且可以单页面控制,页面部署简单,同时支持每天自动截图功能

Excel插件

通过Excel直接连接和导出数据

支持

支持

标签管理器

通过标签管理其提供标签管理功能

支持,通过Tag Manager和DTM提供标签管理功能

支持,通过SafeTag提供标签管理

报表下钻功能

通过报表下钻分析不同数据间的关联关系

支持,SiteCatalyst中支持一级下钻,Discover支持无限下钻

支持,在Q3中最多支持4级下钻分析

网站目标

通过设定网站目标,增加对用户质量的判断维度

支持

支持

自定义功能

自定义维度跟踪

提供更多的自定义维度和变量

15版本提供75个自定义维度和变量

Webtrekk没有的自定义跟踪功能没有渠道维度、时间和指标,其提供了“自定义参数”既可以监测维度,也可以监测指标,数量:

21个自定义session跟踪和营销参数参数、22个自定义页面参数和电子商务参数、25个自定义事件参数、19个独立变量参数,如果不够还可以申请新增。

自定义事件跟踪

提供自定义事件触发跟踪

15版本提供100个自定义事件

自定义指标跟踪

提供自定义指标跟踪

15版本提供75个自定义指标

自定义计算指标

通过指标间的运算生成新的指标

支持

支持,且可以实现基于维度的指标计算

自定义数据分类

通过数据分类,将零散的数据划分成指定的类别

支持,同时支持代码部署和后期数据导入分类,导入通过Classification Importer和Classification Rule Builder进行数据分类

支持,同时支持代码部署和后期数据导入分类,导入方式包括前端数据服务、SOAP、JSON

自定义报表

提前设置好所需要的维度和指标,每次只需点击即可查看

支持

支持

自定义书签

将预置的报表加入书签以方便日后查看

支持

支持

自定义Dashboard

通过自定义Dashboard,方便用户登陆后直接查看整体数据

支持,且支持设置为登陆页

支持,且支持设置为登陆页

其他自定义功能Adobe SiteCatalyst支持自定义菜单,用户可以根据自己的业务组织分析体系Webtrekk支持按分钟级数据自定查看,比如选择3:10-3:30的数据,同时可以自定义数据的任何维度、指标给任何用户、细分组织

高级功能

跨域追踪

跨子域名和跨顶级域跟踪

支持,且提供第一方和第三方Cookie监测

支持,且提供第一方和第三方Cookie监测

跨设备跟踪

跨Web、Wap和App用户登陆后的跟踪

支持,后台通过变量设置后实现

支持,无需设置

订单归因功能

用户通过不同的广告进入网站后下单,不同渠道的订单分配模型

不支持,但可以通过自定义配置,提供渠道间的访问路径

支持,且可以指定渠道在不同位置的计算权重

A/B测试

支持A/B测试和多变量测试功能

支持,但需要同时购买Test&Target实现

支持,Q3本身提供简单的数据测试,同时通过Divolution提供多变量测试和用户Targeting

路径功能

通过路径可以查看某一页面或广告之前或之后的访问流

支持,且可以通过Discover实现无限步骤的连续查看

支持,且可以通过关联分析得数据挖掘数据

漏斗功能

通过漏斗查看某一流程的用户进入或流失情况

支持,且在Discover中支持页面、事件、访问定义的混合漏斗

支持

数据整合能力

整合内外部数据形成全数据

支持,通过Data Source和Classification Importer进行数据导入,通过报表发送、数据仓库和Data Feed进行数据导出。

支持,通过前端数据服务、SOAP、JSON进行数据导入和导出,另外Raw Data提供完整的数据仓库结构和数据导出。

实时数据

通过实时数据查看当前发生的数据

支持,通过“实时报表”和分散在各个报表的实时选项实现

支持,通过Live Analytics实现,维度和功能较多

预警功能

通过设定阀值,对出现异常的数据进行预警提醒

支持,同时可以配合异常检测

支持

自动发送服务

通过自动发送服务,提供数据发布到指定位置

支持,通过Excel插件、SiteCatalyst、数据仓库和Data Feed都可以自定义发送

支持,通过Raw data和Q3报表发送

其他特色功能

Discover是SiteCatalyst的重要补充,它几乎可以实现任意我们能想到的分析需求,但可惜的是由于该功能需要大量的计算支持,权限控制非常严格,我见过的一个跨国集团才一共有5个账号(注意,每个账号只能有一个人同时在线)。

Raw Data是Webtrekk的特色,基于原始数据之上的任意数据切割、下钻、数据回溯、数据整合与权限分配都非常容易。值得一提的是它的数据仓库模型是开发给客户的,方便EDW整合。

费用

按Request付费,它的费用是世界上最高的。

按Request付费,费用相对Adobe的要低大约20%~30%(还要看议价能力)。

(二) 服务价值

服务往往是在选择一个解决方案而非一个工具的重点,服务通常会包括日常支持、专项培训、数据整合和二次开发等需求。关于服务的价值,请查看《商用网站分析工具选择指南——服务篇》

服务点

Adobe Analytics

Webtrekk

日常支持

主要通过代理商服务,原厂直接服务较少

可以通过代理商和原厂同时直接服务

原厂服务团队服务

有,视客户规模通常有驻北京工程师或Adobe产品经理服务

有,每个客户都有Webtrekk服务顾问

中国办公区

Adobe Analytics是没有原厂的中国区销售服务团队,不过最近研发的朋友加入到了服务客户的行列,这对客户来说算是好消息

有,base在北京

二次开发

Adobe Analytics对客户的开发需求响应不足,小的需求比如开个功能用1个周还是可以实现的,大的需求暂时不会响应或会加入未来的开发列表吧

Webtrekk数据分析产品其实是Webtrekk的全部,相对Adobe的大体量来讲,Webtrekk做的更专注,二次开发需求都可以实现,如果是大客户或付费的开发,响应会更快

五、总结

洋洋洒洒写了这么多,也许还是有的同学会问,到底这两个工具哪个好?面对这样的问题,我会这样回答:

Adobe Analytics的特点是功能多,覆盖面广,尤其配合Discover使用会异常强大,它将单体分析的能力做到极致。(我常说,如果没有用过Discover,就连Adobe Analytics一半的功能都没用出来)但可惜的是这种强大的功能受账号数量、个人能力、尤其是网络的限制极高,另外其套件价格高,且对中国市场的重视程度不够。这个工具适合这样的企业:首先费用充足;其次公司有一批会用的牛人同时具备一定开发经验和能力,或者是技术支持要非常到位,否则即使买了也用不出Adobe Analytics的功能;如果购买了其他的Adobe产品会更好的配套使用。

Webtrekk的特点是功能实用,尤其是严谨的数据算法和产品能力极大的提升了数据应用的价值,Webtrekk将数据的科学性加入网站分析领域,并且能很广泛的应用到业务实际,尤其是其细分到分钟粒度、任意切割数据的能力让人叹为观止。中国区的市场慢慢已经打开,并且未来会增加对中国的重视和开发支持。这个工具适合这样的企业:首先费用上有限制;其次公司同样需要有一批会用的牛人和相应的技术支持,但开发可以交给Webtrekk来做;如果企业想把点击流数据导出到本地形成企业数据仓库EDW和商业智能甚至大数据的各项应用,Webtrekk是不二之选。

根据上面的介绍,相信大家一定有自己的见解了,没有最好的工具,只有最适合的工具。另外,我们在做数据时更多的需要关注数据的投入和产出,关注通过数据带来的业务提升。



除非注明,本博客文章均为 数据研究与商业应用(TonySong) 原创.
转载请注明本文地址: http://www.searchmarketingart.com/difference-between-aodbe-analytics-and-webtrekk-2.html