分类目录归档:网站定量分析

网站定量分析方法及实例。

用Engagement衡量用户活跃度

engagement  Engagement(参与度)是一个特殊的度量,Avinash认为Engagement不应该作为网站分析的一个度量,它更像是不愿意去寻求衡量网站是否成功的真正指标时使用的一个借口。他列举了Engagement存在的几个缺陷:  

  •  Engagement对于不同网站而言是不同的,它不是一个统一的度量,难以用一个统一的标准去定义它;
  •  Engagement更多的是从定性的角度来定义的,很多用户参与行为不能很好地量化,因此难以准确地度量;
  •  没有一个评判标准,对于一个网站而言用户参与度到底多少算是好;
  •  因为没有标准的定义,存在不固定性,因此不能作为衡量网站整体表现的参考指标。

  所以,我们可以认为Engagement是一个非标准化的度量,但绕开Avinash所提及的那些误区之后,也许Engagement也并非一无是处,至少它可以作为网站自身的分析指标,衡量用户的活跃度。

如何合理地定义Engagement

  如果你要用Engagement来衡量网站用户的活跃度,并且把它作为一个长期的指标进行趋势分析,那么首先在定义时必须确定那些被归为Engagement的行为是相对固定的,在短期内不会发生变化。如对于一个论坛而言,“发帖”和“跟帖”行为是持续不变的交互行为,这些可以作为识别用户是否参与的标准;而网站中的一个活动按钮或推广链接则不能作为识别Engagement的标准,因为推广活动一般是有期限的,在下线后用户的Engagement就会相应的降低,这样就会导致Engagement的不稳定性,也就失去了分析的意义(或者你只是为了单独分析该次推广活动的用户参与度,那另当别论)。

  这里先举两个例子,显示电子商务网站定义Engagement的例子:

  • 用户的注册行为;
  • 用户放入购物车或购买行为;
  • 用户的售前和售后的反馈行为;
  • 用户对商品的评价。

  再来看一下微博中可以定义为Engagement的一些行为:

  • 用户注册行为;
  • 发布新微博或转发微博;
  • 发表对微博评论;
  • 关注新的用户。

non-standard  可以看到电子商务网站的Engagement的定义与微博大相径庭,这也是为什么说Engagement是一个非标准化的度量的原因,网站间无法比较各自Engagement的优劣。所以Engagement应该作为网站内部分析指标,只用于衡量网站本身用户的活跃度变化趋势。

  即使是一个网站的Engagement也有不同的定义方法,比如我也可以在微博的Engagement定义中加入“收藏微博”的动作,所以我的建议是对于Engagement的定义,一个网站应该在一开始就形成一个标准,如果网站的性质没有发生大的变化就不要轻易修改定义,不然即使是作为网站自身的评价指标,它也不能很好的发挥作用。

  需要注意的是,Engagement只是用户的一系列动作或行为(Actions),并非网站的产出结果(Outcomes)。只能用于衡量网站用户活动的频繁度,进而分析网站用户近期的活跃程度,而不能用于衡量网站的效益

基于Engagement Index的分析

  这里首先推荐一篇Eric T. Peterson在Web Analytics Demystified上的文章——How do you calculate engagement? ,里面提供了关于Engagement的十分全面和精彩的分析。

  分析最好结合实例,所以这里还是以我的博客为例,假如我定义我的博客的Engagement包括以下的行为:

  1. 用户发表评论;
  2. 收藏或分享我的文章;
  3. 订阅我的博客或关注我;
  4. 停留时间(Time on site)超过3分钟。

  首先涉及到数据获取的问题,其实通过点击流+事件追踪,大部分用户的行为还是可以跟踪得到的,这里就不再详细展开了。

  接下去就是如何衡量Engagement。衡量Engagement的指标叫做参与度指数(Engagement Index),既然我们已经定义好了Engagement,我们就可以通过一些方法计算Engagement Index。这里建议Visit(或者叫Session)为单位计算用户一次访问是否Engaged,而不是计算每个Visit中Engage的次数,因为我们无法对某些行为精确定量它的次数,也许发表评论数可以计算次数,但是停留时间的长短就无法用次数来衡量,所以这里统一只判断一个Visit是否发生了上述的任何一类行为,发生则认为这次访问为Engaged,我们可以用一段形象的代码来解释:

boolean isEngaged(Visit) {
         if ( comment || share || feed || follow || time_on_site>=3min )
                  return true;
         else
                  return false; }

  通过调用上面的“函数”我们可以获取到哪些Visits是Engaged Visits,就可以计算出总的Engaged Visits的数量就是Engagement Index的值。但是单纯的一个Engagement Index似乎没有对比的价值,我们可以通过计算跟网站总Visits的比值获取用户的参与率(Engagement Rate)

Engagement Rate = Engaged Visits / All Visits

  也可以用下图来对比Engaged Visits与总Visits的关系:

engaged-visits

  也可以分析定义Engagement中各类行为发生的比率:

engaged-visits-piechart

  这里需要注意的是这个饼图中Visits的总和并非上面计算得到的Engagement Index,因为一个Visit可能既发表了评论,也订阅的博客,那么这个Visit就会被重复记录到两种行为的比例中。根据Engagement进行细分来源的的分析上面推荐的Eric T. Peterson的文章中已经介绍的非常详细,有兴趣的朋友可以自己去看下。

  如果你觉得还意犹未竟,认为那些用户参与的行为并非同等重要的,或许那些订阅了博客的用户或者在博客发表了评论的用户应该显得更加活跃,那么可以给这些行为赋予不同的权重,Sidney的博客中有过相关的介绍——网站分析的最基本度量(8)——Engagement,如果你想让权重显得更加客观和精确,可以使用我之前介绍过的层次分析法(AHP)来计算每个行为的权重,那么Engagement Index就是相应的加权和(定义每个Engaged Visits的数量为Ei,每个Engagement行为的权重为Wi):

engagement-index-wtd

分析Engagement的意义

  有时我们需要细分,而有时我们需要将指标进行聚合来评价总体表现。所以建议不要试图使用次数去计算每个Visit的Engagement Index是多少,次数会由于网站设计上的变化(页面布局、交互按钮的设计等方面的变化)及行为实现的多样性(如果你要发条微博,那实现的途径太多了)而呈现不稳定状态,使用Visits来度量的Engagement更具可比性,最总我们只是进行汇总来衡量整个网站的Engagement情况。

  那么Engagement对于网站来说到底有什么用呢?这里有个最简单的例子,当一个电子商务网站发现近几天的订单量并无发生显著的变化,但是用户活跃度却大幅上升,原因是某款商品的质量存在问题,大量的用户向网站反馈和抱怨,这时如果网站通过分析Engagement监控着用户的活跃度,那么就可以迅速地发现并作出反应。其实这个例子也说明了对于某些网站来说Engagement越高,网站的绩效不一定越好,两者没有直接的联系。

  我们已经步入WEB2.0的时代,用户与网站间的交互更加频繁,网站需要更多活跃用户来增加自身的活力,用户的参与有效地提升了网站与用户之间的信息互通,为网站带来活力的同时也为网站创造着更多的信息,而且很多都是网站本身忽略的或者无法提供的有价值信息,而这些“用户智慧”的注入无疑可以为网站带来更多的关注。

用户综合价值评分体系

user-value-scoring  前面的两篇文章介绍了基于点击流数据的适合所有网站的用户忠诚度分析及应用于电子商务网站的用户分析,并且通过雷达图可以直观的展示用户在各指标上的表现情况,我们可以通过雷达图上图形围成的面积来简单评价一个用户的综合价值。可能大家都有这样的疑问,当各指标的影响权重不同时(比如电子商务网站可能会更看重用户完成的订单数或者在一段时间内的交易额),在这种情况下我们该如何来评价用户的综合价值?如果你看过我的上一篇文章——层次分析法(AHP),相信你已经找到了满意的答案,是的,层次分析法可以很好地解决这个问题。下面就用层次分析法分别介绍一下用户忠诚度评价及电子商务网站用户的综合价值评分:

评价用户忠诚度

  用户忠诚度由4个指标——用户访问频率、最近访问时间、平均停留时间和平均浏览页面数决定,这4个指标没有明显的类别划分,并且可以认为是在同一层次上的相互独立的指标,所以只需要构建2层的模型:

AHP-model-for-user-loyalty

  我们需要计算底层每个指标对用户忠诚度的影响权重,只需要知道底层各指标间的相对比重,这个主要通过专家组或者问卷调研的方法获得数据,这里假设4个指标间两两比较的比重如下表(使用9标度):

  用户访问频率 最近访问时间 平均停留时间 平均浏览页面数
用户访问频率 1 7 3 3
最近访问时间 1/7 1 1/3 1/5
平均停留时间 1/3 3 1 1/3
平均浏览页面数 1/3 5 3 1

——表格中的数据是一个正互反矩阵,即如果“用户访问频率”与“最近访问时间”的比重为7(1-9标度的定义参见层次分析法那篇文章),则对应的表格(第2行第3列)的数值为7,矩阵对角线对称的表格(第3行第2列)的值为1/7。所以两两比较只需要完成对角线一侧的数据,另一侧取对应数值的倒数就可以了。

  因为指标间进行的是两两比较,所以整个矩阵的数据会存在不一致性,比如上表中的数据“用户访问频率”和“平均停留时间”、“平均浏览页面数”的比重都是3,那么一次应该推断“平均停留时间”和“平均浏览页面数”的比重应该是1,也就是同等重要,但是下面该比重的实际数据是1/3。所以可以看到两两比较的过程只在乎两个指标的关系,不存在推导关系,这样就会导致整个矩阵存在不一致性,在计算权重前需要验证矩阵的不一致性系数,只有小于0.1时,该矩阵的数据才能被采纳。

  根据表中两两比较的结果可以通过层次分析法的矩阵运算计算各指标的权重,如果你对excel足够熟悉的话在excel里面也可以实现,这里推荐使用AHP的分析工具——Expert Choice,在这个工具里面只要构建类似上面的树状模型,然后将上表的指标两两比较的结果输入进去,软件就会自动计算出各指标相对于目标的权重及整个模型的CR(一致性概率)。导入上面的模型,输入表格中指标两两比较数据,通过软件计算得出的CR=0.05<0.1,所以数据通过检验,可以进一步获取各指标的权重,得到以下的加权加权计算公式:

  用户忠诚度=用户访问频率*0.525+最近访问时间*0.056+平均停留时间*0.139+平均浏览页面数*0.279

  基于该结果,我们可以将标准化后的用户每个指标的评分数据进行加权求和,还是以网站用户忠诚度分析一文中的两个用户为例,采用的是10分值的评分体系,则计算用户的忠诚度如下:

评分 用户访问频率 最近访问时间 平均停留时间 平均浏览页面数 用户忠诚度
用户1 1.0 5.0 3.0 3.8 2.28
用户2 4.0 9.3 2.4 6.3 4.71
用户n …… …… …… …… ……

  通过上述的层次分析法,将多个评价指标的评分结果加权汇总到一个目标指标,有利于更直接地评价用户,通过上述结果可以算出每个网站用户的忠诚度评分,可以直接排序选择忠诚度排名靠前的用户展开定向营销。

评价电子商务网站用户的综合价值 

  通过上面的分析实例,大家对层次分析的应用应该有了一定的熟悉,那么对于更加复杂的多层次分析模型,层次分析法又是如何实现的呢?下面就以电子商务网站用户分析这篇文章中的指标体系为例来简要介绍下。首先也是构建评价指标体系模型,从电子商务的交易数据中获取的指标更为丰富,我们根据文中对指标的阐述,将指标进一步分层,可以建立起3层结构的模型,如下图:

AHP-model-for-E-commerce-user

  基于这个模型,需要使用3次AHP来计算:

  1. 忠诚度和消费能力对用户价值的影响权重;
  2. 最近购买时间、购买频率和购买产品种类对忠诚度的影响权重;
  3. 平均每次消费额和单次最高消费额对消费能力的影响权重。

  分别在每一步中获取指标两两比较的权重,计算矩阵的一致性概率CR,若通过则计算获得每个指标对上层相应指标的影响权重系数,最终我们可以得到类似如下的结果:

  用户价值=忠诚度*0.67+消费能力*0.33

  忠诚度=最近购买时间*0.12+购买频率*0.64+购买产品种类*0.24

  消费能力=平均每次消费额*0.67+单词最高消费额*0.33

则可以推导的出用户价值的直接计算公式:

  用户价值=(最近购买时间*0.12+购买频率*0.64+购买产品种类*0.24)*0.67+(平均每次消费额*0.67+单词最高消费额*0.33)*0.33  →

  用户价值=最近购买时间*0.08+购买频率*0.43+购买产品种类*0.16+平均每次消费额*0.22+单词最高消费额*0.11

  还是用文中例举的两个用户为例来计算他们的综合价值评分,如下表:

评分 最近购买时间 购买频率 购买产品种类 平均每次消费额 单词最高消费额 忠诚度 消费能力 用户价值
用户1 2 3 3 8 9 2.88 8.33 4.68
用户2 7 7 8 6 5 7.24 5.67 6.72
用户n …… …… …… …… …… …… …… ……

  从上表可以看出,在运用层次分析法获得的分析结果中,不仅能够计算出最终的目标指标(用户价值)的评分,同时也能够计算得到模型的中间层指标(忠诚度和消费能力)的评分,这样我们不仅能够通过直接比较用户的综合价值评分获取网站的重要用户,同时忠诚度和消费能力的评分也为针对用户的细分提供了一个有力的量化数值参考依据,如下图:

E-commerce-user-value-plot

——100个随机样本数据的散点分布,图中的数据仅供参考,不代表任何网站的实际情况

  上面的散点图是对用户忠诚度和消费能力的一个简单展示,从图中点的聚集情况(或者点分布的密集度)可以将图简单分成4块,满足各分块内部的各点间距离最短(最密集)及各分块间的点分布距离最长(最离散),其实可以看做是一个最简单的聚类,从中可以看出电子商务网站用户特征的分布情况:

  • 从C区域可以看出用户较多地分布在忠诚度和消费能力评分为3附近的区域,也是网站最普遍的客户群;
  • B区域的用户是网站的最有价值客户(VIP),但是数量相当稀少,可能不到10%;
  • 在A区域有一个点密集区间(忠诚度1-2、消费能力8-9),可以认为是网站的高级消费用户群,他们消费不多,但消费额很高,如果你的网站提供高级消费品、批发、团购等服务的话,那么他们就可能是那方面的客户群;
  • D区域的用户虽然消费能力也不强,但他们是你的网站的忠实Fans,不要忽视这些用户,他们往往是网站线下营销和品牌口碑传播的有利拥护者。

  通过类似上面的分析过程,我们可以发现电子商务网站用户的某些特征,为网站的运营方向和营销策略提供一定的决策支持。

  这篇文章里面主要讨论的是运用层次分析法对网站用户的一个评价应用案例,其实层次分析法不仅适用于网站用户的评价,同样适用于网站页面、产品、来源、关键词及其它任何牵涉多指标可分层的评价,关键在于如何建立起一套系统的有效的指标评价体系。如果你有更好的扩展思路,欢迎与我评论交流。

电子商务网站用户分析

user-importance  前一篇文章主要是基于点击流数据的用户分析,适合所有网站,而对于一些特殊的网站,可以根据自身所能获取的数据将分析的指标进行扩展或根据自身的特征定制合适的指标,这里主要介绍的是适合一般的电子商务网站的用户分析方法。

  当用户在电子商务网站上有了购买行为之后,就从潜在客户变成了网站的价值客户。电子商务网站一般都会将用户的交易信息,包括购买时间、购买商品、购买数量、支付金额等信息保存在自己的数据库里面,所以对于这些用户,我们可以基于网站的运营数据对他们的交易行为进行分析,以估计每位用户的价值,及针对每位用户的扩展营销(Lead Generation)的可能性。

评价用户价值的指标

  对于评价指标的选择这里遵循3个原则:

  • 指标可量化:没办法,要做定量分析,这个是最基本的前提;
  • 尽可能全面:根据底层数据选择尽可能多的可以获取的指标,这样能够从多角度进行分析和评价;
  • 线性独立:即指标间尽量保持不相关。比如如果选择用户的购买次数和总消费额,那么一定是购买次数越多的用户总消费额越高,也就是导致了评价维度上的重合,而选择购买次数和平均每次交易额可以避免这种相关性产生的弊端。

  根据以上几个原则选取了以下几个指标(同样根据网站的特征选取合适的统计时间段):

  1. 最近购买时间:用户最近一次购买距当前的天数;
  2. 购买频率:用户在这段时间内购买的次数;
  3. 平均每次交易额:用户在这段时间内的消费总额/购买的次数;
  4. 单次最高交易额:用户在这段时间内购买的单词最高支付金额;
  5. 购买商品种类:用户在这段时间内购买的商品种类或商品大类。

用户评价模型的展示

  一样的,也可以用雷达图进行展示,同样也使用离差标准化的方法对每个指标进行消除度量单位的10分制评分。这里具体的方法就不再重复介绍了,请参照——网站用户忠诚度分析这篇文章。下面是一个雷达图的示例:

E-Commerce-user-RadarChart

  通过这个雷达图,我们可以读到比用户忠诚度更多的信息。图中的上面3个指标——最近购买时间、购买频率和购买商品种类可以用来评价用户的忠诚度,而下面的2个指标——平均每次交易额和单词最高交易额可以用来衡量用户的消费能力。如上图,用户1虽然购买频率和购买的广度不高,但其消费的能力较强,而用户2是频繁购买用户,对网站有一定的忠诚度,但其消费能力一般。所以图形的上半部分面积较大的用户拥有较高的忠诚度,而下半部分面积较大的用户具有更高的消费能力。这两类用户都是网站的有价值客户,但由于其类型的不同,在营销策略上可以分开对待。

用户交易行为分析的意义

  • 发现网站的高价值客户(VIP),为客户关系管理(CRM)及保持有价值客户提供支持;
  • 发掘网站的可发展用户,对于一些新客户或潜力客户进行针对性营销;
  • 及时发现可能流失的客户,及时采取有效措施;
  • 根据用户交易行为细分客户群,实施有针对性的营销策略。

网站用户忠诚度分析

user-loyalty-analysis  忠诚用户不仅能为网站创造持续的价值,同时也是网站品牌口碑推广的重要渠道,所以目前网站对忠诚用户愈加重视。可能很多网站或者网站分析工具对用户做了“新用户”和“回访用户”的划分,但是单单区分新老用户是不够了,我们需要更加完善的指标来衡量网站用户的忠诚度。

  用户忠诚度(Loyalty),指的是用户出于对企业或品牌的偏好而经常性重复购买的程度。对于网站来说,用户忠诚度则是用户出于对网站的功能或偏好而经常访问该网站的行为。根据客户忠诚理论,忠诚度可以由以下4个指标来度量:

  • 重复购买意向(Repurchase Intention:购买以前购买过的类型产品的意愿;
  • 交叉购买意向(Cross-buying Intention:购买以前为购买的产品类型或扩展服务的意愿;
  • 客户推荐意向(Customer Reference Intention:向其他潜在客户推荐,传递品牌口碑的意愿;
  • 价格忍耐力(Price Tolerance:客户愿意支付的最高价格。

量化网站的用户忠诚度

  以上的4个指标对于电子商务网站而言,可能还有适用性,但对于大多数网站是不合适的,所以为了让分析具有普遍的适用性,同时为了满足所有的指标都可以量化(上面的客户推荐意向比较难以量化),以便进行定量分析的要求,这里可以选取Google Analytics中对用户忠诚度的4个度量指标:Repeated Times、Recency、Length of Visit、Depth of Visit,即用户访问频率、最近访问时间、平均停留时间、平均访问页面数,这些指标可以直接从网站的点击流数据中计算得到,对所有的网站都适用,下面看一下这些指标的定义及如何计算得到(一些网站度量的相关定义请参考——网站分析的基本度量):

  • 访问频率:用户在一段时间内访问网站的次数,即每个用户Visits的个数;
  • 最近访问时间:用户最近访问网站的时间,因为这个指标是个时间点的概念,所以为了便于度量,一般取用户最近访问时间距当前的天数。
  • 平均停留时间:用户一段时间内每次访问的平均停留时间,即每个用户Time on Site的和/Visits的个数;
  • 平均访问页面数:用户一段时间内每次访问的平均浏览页面数,即每个用户Page Views的和/ Visits的个数。

  统计数据的时间区间也是根据网站的特征来定的,如果网站的信息更新较快,用户访问较为频繁,那么可以适当选取较短的时间段,这样数据变化上的灵敏度会高些;反之,则选择稍长的时间段,这样用户的数据更为丰富,指标的分析结果也会更加准确有效。

用户忠诚度的展示和比较

  上面的4个指标均可以被量化统计得到,单一的指标也是没有意义的,我们需要通过比较来找出哪些是忠诚用户,哪些是流失用户,可以先对指标进行一些处理,以便使它们之间更具可比性,可以参考之前的文章——数据的标准化),这里我采用的是min-max标准化的方法,首先将所有指标的数值全部转换到[0,1]区间,再进行倍数放大,比如使用10分制进行评分,则可以乘10,数据就全部分布在[0,10]区间内了,如下图:

    访问频率 最近访问时间 平均停留时间 平均访问页面
用户1 数据 2次 15天前 150秒 3页
标准化 0.10 0.50 0.30 0.38
评分 1 5 3 3.8
用户2 数据 8次 2天前 120秒 5页
标准化 0.40 0.93 0.24 0.63
评分 4 9.3 2.4 6.3

——表中的数据只是简单的举例,实际情况需要根据每个指标的最大最小值进行计算

  根据上表的数据,我们已经将所有指标统一到了同一个评分区间,那么就可以使用雷达图对用户的忠诚度进行展示。用雷达图展示有以下几个优点:

  • 可以完整地显示所有评价指标;
  • 显示用户在各指标评分中的偏向性;
  • 可以简单分析用户忠诚度的综合评分,即图形围成的面积(假设四个指标的权重相等,若重要程度存在明显差异,则不能用的面积来衡量);
  • 可以用于用户间忠诚度的比较。

  下面是根据上表绘制的雷达图示例:

user-loyalty-RadarChart

用户忠诚度分析的意义

  那么基于这个展示的结果我们能做些什么呢?其实对于任何网站而言,有两个方向是一致的:保留忠诚用户减少流失用户。基于上面的用户忠诚度评价体系扩展开来就是:

  1. 分析忠诚用户的行为特征,努力满足他们的需求,提高他们的满意度;
  2. 从最近访问时间的指标数据机用户忠诚度变化趋势中发现一些可能正在流失的用户,分析他们流失的可能原因,并试图挽留流失用户;
  3. 比较忠诚用户和流失用户在指标数值上的差异,寻找哪些指标的差距导致了用户忠诚度的降低,优化网站在这些方面的表现。

  所以,我这里使用的是基于用户访问频率、最近访问时间、平均停留时间、平均访问页面数这4个指标来评价网站用户的忠诚度,并用雷达图进行展示和比较,也许你可以根据自己网站的特征找到更加适合的指标和展示方式,而最终需要做的是能够更加精确地找到网站的忠实用户,并努力留住他们。

网站转化率与漏斗模型

  前段时间刚完成了一个分析网站流程的每个步骤的流失率,并用漏斗模型进行展示的需求,这里跟大家来分享一下。分析过程可以从以下三步展开:确定需要分析的访问路径或操作流程,收集数据并分别统计出该路径中每一步的人数,最后用漏斗模型展示结果。

用户访问路径(Path Analysis)

  之前的从WEB日志到点击流这篇文章中对点击流的概念进行了介绍,其实一个点击流就是用户的一次访问路径。在大多数情况下用户的访问路径随意的,无序的,用户在访问一个网站时可能会经常使用后退、返回主页或者直接点击某个链接等,不同用户访问路径的重合度可能只有1%,分析这些无序的路径是毫无意义的。

  所以,我们要分析的是网站中的一些关键路径(Key Path),即用户是为了某个目标而进入了一个相对标准的有序的路径,用户的目标就是为了到达“出口”,而不是随意游荡。如电子商务网站的注册流程、购物流程,应用型网站的服务使用流程等。举一个电子商务网站购物流程的简单例子:

E-Commerce-Shopping-Process

  于是,我们就可以根据这些关键路径来计算每一步的转化率了。

转化率(Conversion Rate)

  转化率,顾名思义,就是从当一个页面进入下一页面的人数比率,比如访问我的博客首页的用户有30,而从首页点击进入本文的用户有12,那么从首页到这篇文章的转化率就是12/30=40%。当然,我们可以根据用户的访问路径计算每个页面到下个页面的转化率,同样这类工作大部分也是没有意义的,我们需要抓住重点——关键路径的转化率。

  以上面的购物流程为例,我们可以分别统计出这5步中每一步的人数,然后计算得到每一步的转化率:

  浏览 购物车 订单 支付 完成交易
人数 2071 622 284 235 223
上一步转化率 100% 30.0% 45.7% 82.7% 94.9%
总体转化率 100% 30.0% 13.7% 11.3% 10.8%

GA-E-Commerce-Funnel
  通过对这些数据的统计,我们已经可以初步判断该流程转化率的情况,及每一步的流失率情况。当然,为了让分析的结果更加具体形象,我们可以借助一些图表工具,漏斗模型用在这里正好恰当不过了。

漏斗模型(Funnel Model)

  漏斗模型不仅显示了用户在进入流程到实现目标的最终转化率,同时还可以展示整个关键路径中每一步的转化率。Google Analytics提供了漏斗模型很好的分析和展示方案,具体的方法可以参考蓝鲸的文章——Google Analytics功能篇—目标和渠道,Google Analytics中漏斗模型的展示可以见右边的截图。

  因为可以拿到原始数据,所以我选用了更加灵活,定制程度更高的excel表格来处理。为了能显示漏斗的效果,在网上找到了一个很实用的方法——设置占位数据,然后用条形堆栈图展示数据,并将占位数据的数据条颜色去除,显示效果上就是下面每个数据条都居中了,占位数据=(进入人数-当前人数)/2,结果如下图:

Funnel-Model

  这里的下面每个蓝条的左边都是占位数据条,只是它们被“隐形”了而已。

  需要注意的是,单一的漏斗模型对于分析来说没有任何意义,我们不能单从一个漏斗模型中评价网站某个关键流程中各步骤的转化率的好坏,所以必须通过趋势比较细分的方法对流程中各步骤的转化率进行分析:

  • 趋势(Trend:从时间轴的变化情况进行分析,适用于对某一流程或其中某个步骤进行改进或优化的效果监控; 
  • 比较(Compare:通过比较类似产品或服务间购买或使用流程的转化率,发现某些产品或应用中存在的问题;
  • 细分(Segment:细分来源或不同的客户类型在转化率上的表现,发现一些高质量的来源或客户,通常用于分析网站的广告或推广的效果及ROI。

  所以,漏斗模型适用于网站中某些关键路径的转化率的分析,以确定整个流程的设计是否合理,各步骤的优劣,是否存在优化的空间等。试着去了解用户来你的网站的真正目的,为他们提供合理的访问路径或操作流程,而不是一味地去提高转化率。

向上营销、交叉营销与关联推荐

  我们会发现很多网站都具备了内容推荐的功能,不仅是像B2C电子商务类的卓越的图书推荐,也包括兴趣类网站像豆瓣的豆瓣猜等。这类功能无疑在帮助用户发现需求,促进商品购买和服务应用方面起到了显著性的效果。那么这类的推荐是怎么得到的呢?其实跟网站数据分析不无相关,我们可以来简单看一下它的原理和实现。

  关联推荐在营销上被分为两类:

  向上营销(Up Marketing):根据既有客户过去的消费喜好,提供更高价值或者其他用以加强其原有功能或者用途的产品或服务。

  交叉营销(Cross Marketing):从客户的购买行为中发现客户的多种需求,向其推销相关的产品或服务。

  向上营销是基于同类产品线的升级或优化产品的推荐,而交叉营销是基于相似但不同类的产品的推荐。举个简单的例子,可以看一下苹果的产品线:

Apple-products-compare

当你购买一个ipod nano3的时候,向你推荐升级产品nano4、nano5或者功能类似的itouch就叫做“向上营销”;而推荐Iphone、Mac或ipad的时候就是“交叉营销”了。

  而关联推荐在实现方式上也可以分为两种:以产品分析为基础的关联推荐和以用户分析为基础的关联推荐。产品分析的关联推荐指的是通过分析产品的特征发现它们之间的共同点,比如《Web Analytics》和《Web Analytics 2.0》的作者都是Avinash Kaushik,而且书名都包含Web Analytics,都是网站分析类的书籍,同时也可能是同一个出版社……那么基于产品的关联就可以向购买了《Web Analytics》的用户推荐《Web Analytics 2.0》。而基于用户分析的推荐是通过分析用户的历史行为数据,可能会发现购买了《Web Analytics》的很多用户也买了《The Elements of User Experience》这本书,那么就可以基于这个发现进行推荐,这种方法就是数据挖掘中的关联规则(Association Rules)挖掘,其中最经典的案例就是沃尔玛的啤酒和尿布的故事。

beer-and-diapers

  目前很多的关联推荐还是基于产品层面的,因为实现上更为简单(对于网站而言,产品数据明显少于用户行为数据,而且可能相差好几个数量级,所以分析工作就会轻很多),基于产品的推荐更多地以上面所述的两种营销手段来实现,更偏向于传统的“推式”营销(个人对这种营销方式比较没有好感,尤其“捆绑销售”之类)。

基于用户行为分析的关联推荐

  所以个人更偏向于基于用户分析的实现方式,这样更有利于发现用户的潜在需求,帮助用户更好的选择它们需要的产品,并由用户决定是否购买,也就是所谓的“拉式”营销。通过向用户推荐产品或服务,激发用户的潜在需求,促使用户消费,更加符合“以用户为中心”的理念。所以下面主要简单描述下以用户行为分析为基础的关联推荐,无论你是电子商务网站或是其他任何类型的网站,其实都可以实现这个功能,只要你具备以下前提:

  1. 能够有效地识别网站用户;
  2. 保留了用户的历史行为数据(点击流数据(clickstream)或运营数据(outcomes));
  3. 当然还需要一个不错的网站数据分析师。

  这里以电子商务网站为例来说明一下关联规则的具体实现。目前大部分电子商务网站都提供用户注册的功能,而购物的用户一般都是基于登录的条件下完成的,所以这里为用户识别提供了最为有效的标示符——用户ID(关于用户识别的方法,请参考这篇文章——网站用户的识别);同时网站会把所有用户的购物数据储存在自己的运营数据库里面,这个为用户行为分析提供了数据基础——用户历史购物数据。所以满足了上述的前两个条件,我们就可以着手进行分析了。

  关联规则的实现原理是从所有的用户购物数据中(如果数据量过大,可以选取一定的时间区间,如一年、一个季度等),寻找当用户购买了A商品的基础上,又购买了B商品的人数所占的比例,当这个比例达到了预设的一个目标水平的时候,我们就认为这两个商品是存在一定关联的,所以当用户购买了A商品但还未购买B商品时,我们就可以向该类用户推荐B商品。如下图:

Relevance-Recommendation

  从上图可以看到其中牵涉3个集合:所有购买过商品的用户全集U、购买了A商品的用户集合A以及在购买了A商品之后又购买了B商品的用户集合G。基于这3个集合可以计算关联规则挖掘中的2个关键指标——支持度(Support)置信度(Confidence)

  支持度=购买了A和B商品(集合G)的人数/所有购买过商品(集合U)的人数

  置信度=购买了A和B商品(集合G)的人数/购买了A商品(集合A)的人数

  得到这两个指标之后,需要为这两个指标设立一个最低门槛,即最小支持度和最小置信度。因为在用户的购买行为中,购买A商品的用户可能不仅购买B商品,还购买了C、D、E……等一系列商品,所以我们需要分别算出所有这些组合的支持度和置信度,只有满足比如支持度>0.2,置信度>0.6的这些商品组合才可以认为是有关联的,值得推荐的。

  当然,如果你的网站不是电子商务网站,你同样可以用用户浏览网站的点击流数据实现关联推荐的功能。同样是基于用户历史行为,比如浏览了A页面的用户也浏览的B页面、观看了A视频的用户也观看了B视频、下载了A文件的用户也下载了B文件……

  数据挖掘中的关联规则挖掘一般采用基于频繁集的Apriori算法,是一个较为简单有效的算法,这里就不具体介绍了,有兴趣的朋友可以去查下资料。

在进行关联规则分析时需要注意的一些问题

  • 注意关联推荐的适用范围和前提条件,并不是每一类网站都适合或需要进行关联推荐的;
  • 最小支持度和最小执行度的设立需要根据网站运营的特征设定,不宜偏高或偏低,建议基于实验或实践的基础上不断优化,寻找一个最佳的权衡点。
  • 需要特别注意的是,在关联规则中A商品与B商品有关联,并不意味着B商品与A商品的关联也成立,因为两者的置信度算法是不同的,关联方向不可逆。
  • 关联规则分析在算法上其实并不难,但是要将其在网站上真正实现好,在满足上面3个前提的基础上还需要持续地优化算法,而更主要的是需要网站各部门的协作实现。

  所以,基于用户行为分析的关联推荐完全从用户的角度进行分析,比单纯地比较产品间的关联更为深入和有效,更加符合用户的行为习惯,有利于发现用户的潜在需求,不妨尝试一下。

Abandonment Rate的影响因素

cart-abandonment  前几天看到了Sidney写的一篇文章——电子商务(B2C)网站的Abandonment Rate,里面详细介绍的B2C网站中购物车及付款流程可能造成交易的中断,客户放弃购买该商品的情况,也就是Abandonment Rate。文章中提到了Abandonment Rate可能涉及的影响因素,及如何降低Abandonment Rate的一些方法,感觉对提高电子商务网站商品的销售转化率十分有效。其中谈到Abandonment Rate与商品的价格或商品的销售组合之间可能存在某种联系,为了求证这类联系是否存在,我们可以使用一些定量分析的方法对可能影响Abandonment Rate的某些因素进行了分析。

哪些因素影响了Abandonment Rate

  一般B2C电子商务网站都会基于商品进行分类,如下图:

E-Commerce-Products

  以卓越销售的商品为例,卓越销售商品以图书音像为主、电子日用品为辅,其下的产品分为图书音像、消费电子、日用消费品等类目,之下还有子类目的划分,最底层就是其销售的商品,如图书Web Analytics 2.0、某品牌的手表等,那么可以整理得到如下的商品列表:

商品类目1 商品类目2 商品类目3 ……
商品1 商品3 商品4  
商品2   商品5  
……   ……  

  根据上面的表格,我们可以通过横向对比和纵向对比的方法对Abandonment Rate影响因素进行分析。因为不同的商品类目可能在商品的品牌口碑、本质特征、展示方式、购物车流程等方面存在差异,通过横向比较商品类目的Abandonment Rate是否存在显著性差异,可以确定这么因素的影响情况;而同一类目中商品的纵向对比,可以在控制商品的品牌口碑、本质特征、商品展示方式、购物车流程相似的条件下,比较商品的关注度、价格、购买数量、促销等因素的影响情况。

不同商品类目间的横向比较

  样本数据的选择:为了说明差异是有商品类目的不同说引起的,我们需要选择商品受关注程度、平均价格、销售情况、促销频率等较为相近的2个商品大类(如鼠标和帽子),以排除这些因素的影响。同时选取合适的时间跨度,你可以选择一个月、一个季度或者任意的时间区间来分析该时间段内样本数据特征。如:

categories-AR-compare

  样本数据是关于某时间发生频数的统计,所以比较两组样本间的差异可以选择四格表卡方检验的方法,这里的检验结果χ2=16.84,显著性水平p<0.01, 差异有高度统计学意义,拒绝零假设,认为两组数据存在显著性差异。

同一类目中不同商品的纵向比较

  样本数据的选择:同样我们需要选择关注度、价格、销售数量、促销频率等存在一定差异的相同类目下的商品(如不同品牌、价格和款式的手表)来进行比较分析。同样选取合适的数据时间段,如统计得到以下数据:

商品  关注度  价格 销售数量 促销比率 Abandonment Rate
1 3258 588 251 0.16 0.4487
2 1569 998 76 0.05 0.4711
3 2965 158 206 0.20 0.2639
4 236 2568 15 0 0.5714
5 985 1128 3 0 0.3843

  我们可以通过excel的数据分析功能获取各列间的相关系数r,首先可以根据r值的正负确定是正相关还是负相关,然后比对以下的相关系数与相关程度的对照表,确定相关性的强弱:

|r|>0.95 |r|>=0.8 0.5<=|r|<0.8 0.3<=|r|<0.5 |r|<0.3
显著性相关 高度相关 中度相关 低度相关 不相关

  那么根据结果可以得出以下结论:Abandonment Rate与价格高度正相关,与促销频率中度负相关,与关注度中度负相关,与销售数量低度负相关。

如何降低Abandonment Rate

cart-confirmed

  既然已经知道有这些因素影响了B2C的Abandonment Rate,那么我们如何通过网站优化来降低Abandonment Rate呢?其实Sidney在他的文章中已经提到的许多解决的方法是十分有效的,下面根据以上影响因素分析的结果分各因素来简要阐述下我们可以做些什么?

商品类目间的差异

  如果通过比较分析得出2个或多个商品类目间存在显著的差异,那么首先要确定这个差异是不是由于商品本质特征的不同会导致,因为商品的某些本质特征有时并不是能够人为控制的,诸如:

  • 商品的品牌口碑:网购的用户可能会偏向品牌型产品;
  • 规格的固定性:电子商品的规格确定性会高于衣物等日用品,所以鼠标的Abandonment Rate会低于帽子也不奇怪;
  • 售后服务:一般商品的售后服务由厂商提供,那么这个因素一般是电子商务网站无法控制的。

  由于以上原因造成的Abandonment Rate偏低的商品类目,网站方面可能就力不从心了,然而如果差异是由一下因素造成的,那么网站就得找找自己的原因的:

  • 商品展示方式的差异:布局、图片、商品描述、一些有误导性的信息……这些也会造成Abandonment Rate的偏高;
  • 购物车流程的差异化:用户可能在购买鞋子时因为需要填写尺码、颜色等信息而直接关闭浏览器离开了,但在购买图书是可能就不会出现这种情况;
  • 用户购买体验:如果网站提供了用户的交流平台,那么客服人员对某类商品的不熟悉或不耐烦也会造成该商品的Abandonment Rate过高。

商品个体因素的影响

  对于单个商品而言,关注度、价格、销售量、促销频率这些因素可能就决定了Abandonment Rate,但是麻烦来了,以上的这些因素可能很难做持续的改进,这时我们可以采取互补的方式,即通过提高某些有利因素来降低某些不利因素的影响。

  比如我们发现A产品由于价格过高而造成与同类商品相比Abandonment Rate偏高,而分析证明促销对于降低该类商品的Abandonment Rate有显著的有效性,那么我们可以是增加A产品的促销频率;或者提高关注度对降低Abandonment Rate有效,那么可以把A产品放到网站更加显眼的位置……

  当然,由于电子商务网站商业模式上的差异,对Abandonment Rate的影响因素可能各不相同,上面也只是举例说明了一部分因素。所以,最好根据自己网站的特点来选取可能的影响因素进行分析,方法可以借鉴上面的两种,如果你有更好地分析方法,欢迎跟我分享。

电子商务网站RFM分析

  根据美国数据库营销研究所Arthur Hughes的研究,客户数据库中有三个神奇的要素,这三个要素构成了数据分析最好的指标: 

  • 最近一次消费(Recency)
  • 消费频率(Frequency)
  • 消费金额(Monetary)

  RFM分析原多用于传统营销、零售业等领域,适用于拥有多种消费品或快速消费品的行业,只要任何有数据记录的消费都可以被用于分析。那么对于电子商务网站来说,网站数据库中记录的详细的交易信息,同样可以运用RFM分析模型进行数据分析,尤其对于那些已经建立起客户关系管理(CRM)系统的网站来说,其分析的结果将更具意义。

基本概念解释

  RFM模型是衡量客户价值和客户创利能力的重要工具和手段。RFM分析模型主要由三个指标组成,下面对这三个指标的定义和作用做下简单解释:

最近一次消费(Recency)

  最近一次消费意指用户上一次购买的时间,理论上,上一次消费时间越近的顾客应该是比较好的顾客,对提供即时的商品或是服务也最有可能会有反应。因为最近一次消费指标定义的是一个时间段,并且与当前时间相关,因此是一直在变动的。最近一次消费对营销来说是一个重要指标,涉及吸引客户,保持客户,并赢得客户的忠诚度。

消费频率(Frequency)

  消费频率是顾客在一定时间段内的消费次数。最常购买的消费者,忠诚度也就最高,增加顾客购买的次数意味着从竞争对手处偷取市场占有率,由别人的手中赚取营业额。

  根据这个指标,我们又把客户分成五等分,这个五等分分析相当于是一个“忠诚度的阶梯”(loyalty ladder),其诀窍在于让消费者一直顺着阶梯往上爬,把销售想像成是要将两次购买的顾客往上推成三次购买的顾客,把一次购买者变成两次的。

消费金额(Monetary)

  消费金额是对电子商务网站产能的最直接的衡量指标,也可以验证“帕雷托法则”(Pareto’s Law)——公司80%的收入来自20%的顾客。

数据获取与分析

  在从数据库中提取相关数据之前,首先需要确定数据的时间跨度,根据网站销售的物品的差异,确定合适的时间跨度。如果经营的是快速消费品,如日用品,可以确定时间跨度为一个季度或者一个月;如果销售的产品更替的时间相对久些,如电子产品,可以确定时间跨度为一年、半年或者一个季度。在确定时间跨度之后就可以提取相应时间区间内的数据,其中:

  最近一次消费(Recency),取出来的数据是一个时间点,需要由 当前时间点-最近一次消费时间点 来作为该度量的值,注意单位的选择和统一,无论以小时、天为单位;

  消费频率(Frequency),这个指标可以直接在数据库中COUNT用户的消费次数得到;

  消费金额(Monetary),可以将每位客户的所有消费的金额相加(SUM)求得。

  获取三个指标的数据以后,需要计算每个指标数据的均值,分别以AVG(R)、AVG(F)、AVG(M)来表示,最后通过将每位客户的三个指标与均值进行比较,可以将客户细分为8类:

Recency  Frequency Monetary 客户类型
重要价值客户
重要发展客户
重要保持客户
重要挽留客户
一般价值客户
一般发展客户
一般保持客户
一般挽留客户

——“↑”表示大于均值,“↓”表示小于均值,多谢nancy的提醒,表中Recency的箭头应该是倒过来的,下面的图中也是

结果的展示

  RFM模型包括三个指标,无法用平面坐标图来展示,所以这里使用三维坐标系进行展示,一种X轴表示Recency,Y轴表示Frequency,Z轴表示Monetary,坐标系的8个象限分别表示8类用户,根据上表中的分类,可以用如下图形进行描述:

RFM-model

  RFM分析也存在着一定的缺陷,它只能分析有交易行为的用户,而对访问过网站但未消费的用户由于指标的限制无法进行分析,这样就无法发现潜在的客户。所以在分析电子商务网站的用户时,由于网站数据的丰富性——不仅拥有交易数据,而且可以收集到用户的浏览访问数据,可以扩展到更广阔的角度去观察用户,这方面的定量分析会在之后的网站用户分析中进行详细叙述。

以上部分的概念来源于MBA智库百科