标签归档:数据标准化

合并和比较度量

——数据的上下文4

Combined-and-Comparative-Metrics  往往我们在做分析的时候需要结合各类基本的指标进行二次计算合并得到一个可以用于进行综合评价或比较的度量,这个过程中就需要涉及到一些指标的合并技巧,和比较基准的设定。其实之前“数据上下文”的系列文章中也一再强调了我们需要为指标设定合理的参考系来评价指标的趋势或表现的好坏,之前提供了一系列的方法,但这篇文章里面要介绍的方法应该是最简单方便的,同时不失实用性,得益于《用户体验度量》这本书中的介绍,所以这篇文章更像是一篇读书笔记,内容基本整理总结自《用户体验度量》第8章——合并和比较度量,当然不再局限于用户体验层面,结合了网站分析层面的思考。

  这里我根据合并和比较类型的不同将内容分成:简单合并度量目标比较百分比评分度量均值比较标准化度量组间比较与专家绩效的比较

简单合并度量目标比较

  这是一个最简洁有效的KPI评价模式。首先说下简单合并,举个例子,电子商务网站每天产生很多订单,这些订单由许许多多的网站访问带来,一旦某个访问产生了订单,我们就说这个访问产生了转化,所以最基础的统计指标没有转化率,只有网站的访问量和订单数,转化率是由“订单数/访问数”计算得到的。那么为什么要计算转化率,用订单量来评价网站绩效不是也可以吗?很简单,因为订单量会受到网站访问量的影响,而很多时候网站的访问量无法控制,所以我们不能说100次访问产生的10个订单一定比150次访问产生的15个订单要差,如果用着两个指标的合并度量——转化率来评价,显然更科学,因为都是10%,两者的绩效是相当的。

  因为合并度量,如转化率、人均消费等指标一般较为稳定,波动幅度不会太大,我们一般会将这些指标作为网站的KPI,同时我们会为每个KPI设定一个预期的目标,比如我们设定网站的转化率目标是10%,那么我们来看看网站一个月内的目标达成比例有多高:

simple-combined-metric-goal

  我们可以看到在5月份的31天时间里,有26天的转化率等于或者超过了目标值,从而目标的达成率就是83.87%(26/31),还算是一个不错的成绩。也许你的团队正在抱怨KPI太过苛刻,毕竟数据会受诸多因素的影响,要保证每天10%以上确实有难度,如果真能完全做到,那就是目标的设定过低,目标永远应该临界于可以达成和不能达成之间才是合理的,所以这里使用目标达成率来评估可能会更加合理。

百分比评分度量均值比较

  但是有的时候我们没法为每个指标设定目标,毕竟目标更多的是为了控制网站的整体绩效或者KPI,对于一些基于细分的度量,我们需要使用另外的合并和比较方法,所以就有了基于百分比的评分。

  同样很简单,百分比评分就是将指标的值都转化成百分比的形式,相当于该指标在100分制的条件下的得分有多少。如何将指标转化成为百分比的数值,一个很简单的方法就是所有的指标处于总体的最大值,这个方法对于所有大于0且分布不是特别离散的指标都是有效的。比如我们评价网站商品的质量,权衡商品的浏览量和转化率这2个指标,我们知道转化率本身就是一个百分比,但显然也是需要进行转化的,所以我们将每个商品的浏览量和转化率分别除以总体浏览量最大值和总体转化率最大值得到相应的百分比评分:

  浏览量 转化率 浏览量评分 转化率评分 评分均值
商品A 563 7% 100 78 88.9
商品B 121 9% 21 100 60.7
商品C 87 8% 15 89 52.2
商品D 367 5% 65 56 60.4

  上面的均值基于简单平均的计算,同样我们可以对各指标引入权重进行加权平均,比如我们分别给浏览量评分和转化率评分分别赋予40%和60%的权重:

  浏览量 转化率 浏览量评分 转化率评分 加权评分均值
商品A 563 7% 100 78 86.7
商品B 121 9% 21 100 68.6
商品C 87 8% 15 89 59.5
商品D 367 5% 65 56 59.4

  这样我们就可以根据最终的评分均值寻找那些高质量的商品进行推荐了。

标准化度量组间比较

  又是标准化,是不是有点看腻了,但确实它在指标合并的领域扮演着极其重要的角色,同样推荐阅读——数据的标准化这篇文章。

  方法这里不再详细介绍,还是举个例子,另外值得注意的一点就是对“逆指标”的处理,逆指标指的是那些表现的值刚好与绩效相反的指标,即值越大绩效越差,值越小绩效越好,网站分析中典型的逆指标就是Bounce Rate。因为标准化后的指标符合均值是0标准差是1的正态分布,所以对逆指标的处理只需要对标准化后的数据乘-1就可以了,也非常简单。这里以网站Landing Page优化为例,来看看如何有效地评价3个Landing Page的优化方案哪个才是最优的:

  Bounce Rate 转化率CR BR标准化 CR标准化 标准化均值
方案A 45% 8% -0.651 0.873 0.762
方案B 46% 5% -0.501 -1.091 -0.295
方案C 57% 7% 1.151 0.218 -0.467

  同样使用了求均值的方法,将各指标标准化后取均值进行比较(注意这里取均值时对BR标准化的结果乘了-1),我们就可以轻而易举的看出A方案的效果是最优的,这也是一种“目标决策”的最简单应用。这里需要注意的是指标标准化后的数值的分布是不定的,不像上面的百分比一定是在[0,100]之间,所以标准化后的数值本身不具有实际意义,只有将它放入比较环境中才有分析的价值,所以指标标准化的方法只适用于组间的比较。

与专家绩效的比较

  如果你能够得到一个对该领域的专业知识和技能非常熟悉的专家团队的支持,那么对网站的评价会容易许多,因为专家对网站的使用和评分就可以作为网站的最优标准。

  其实一般情况下我们认为专家的绩效是一个理想化的状态,比如专家能够在最短时间内通过最少的操作完成预期的任务,所以我们可以将专家组的数据作为网站可以达到的优化目标,而目前数据与专家数据的差异就是目前网站存在的优化空间,这样的分析让我们能足够明确自身在哪些模块距离最优的水平最远,同时优化的空间最大,我们完全可以从这些方面入手来实现最快最大的提升。

  除了介绍以上的度量合并比较的方法外,书中还介绍了使用柱状折线组合图和雷达图来展现多指标的比较环境,因为这些在之前的文章中都有提及,这里不再介绍了。

  其实上面介绍的都是最简单实用的指标比较处理的方法,这些方法无论在哪类公司或者哪些指标上都能够进行套用,甚至基于这些最基本的取百分比、取平均、目标比较等方法可以举一反三扩展出更加灵活有效的分析方法。这时候就需要动用你的智慧,为你的数据选择最合适的方法了。

网站内容评分模型

scoring   我们可以看到目前很多的网站都会有内容评分,无论是电子商务、信息分享还是内容下载。内容的评分主要分为两类,一类是用户对内容的评分,主要针对用户的使用感受,如电子商务网站的商品评分,内容分享网站的内容评分等,这个也是目前最普遍的评分模式,而内容的综合评分的计算也相对比较简单,大多是取所有用户评分的均值;另一种评分方式就是网站自身对内容的评分,主要针对用户的历史行为数据,如通过用户对内容的访问情况评价内容的热门程度等。

  这里要介绍的网站内容评分模型主要针对第二类的评分方式,因为评分的分值是相对固定的,100分制、10分制还是5分制,而用户相对于每个内容所产生的行为数据的数值却千差万别,可能是千数量级,也可能是万数量级,甚至是百万数量级,如何将这些数据转化成标准的评分体制,并让最终的分值分布更加合理化、有效化,从而让真正优质的内容获得较高的评分,并推荐给用户,是这里重点要解决的问题。

内容评分实例

  介绍应用的案例前,先要说明下应用的环境和具体的需求:假设有一个内容分享网站,需要将网站中的内容进行评分,以5分制的形式展现,即每个内容的评分只可能出现1-5这5个分值,目的是展现出网站中每个内容的热门程度,为用户的选择和阅读提供参考。

  这是一个最简单的内容评分的应用,上面已经非常明确的说明了评分的目的——区分内容的热门度,以及最终的数据展现——以5分制的形式展现。对于这样一个明确了的数据需求,我们就可以选择指标、搭建模型、并最终输出结果。

1、选择指标

  评价内容的热门度,貌似挺简单的,直接用内容浏览量(PV)作为评定指标不就行了?确实,PV是个不错的选择,也是最简单的一种选择,但其实还有更好的选择,访问数(Visits),访问用户数(UV),这两个指标能剔除同一个用户短时间内连续刷新同一内容的情况,所以我们不妨选择访问用户数UV来作为评价指标。

2、构建评分模型

  现在开始才是文章的关键内容,显然,需要对内容的热门程度进行评价首先要消除指标的度量单位,并把分值的分布区间控制在要求的范围内——1-5分。

  消除度量单位?也许你已经想到了,是的,还是数据的标准化,这篇文章中的方法已经在多处使用,可以说是很多数据分析和数据挖掘的基础步骤。

Min-Max归一化评分

  Min-Max是最常用的数据归一化方法(详见数据标准化这篇文章的描述),处理后的数据分布在[0,1]的区间内,接下来只要把0-1的数值转化1-5这5个分值就行。很简单,先乘以4使数据落在[0,4]的分布区间,四舍五入,是不是只剩下0-4这5分分值了,再加1就可以得到我们想要的结果了。我们来看看处理后的各分值内容分布情况的示例:

min-max-scoring

  根据上面各分值内容分布图可以看出Min-Max的评分结果的每个分值的内容数量分布是不可控的,一般会跟网站中热门内容和冷门内容的比例直接相关,所以当某些网站的热门内容只占网站所有内容的20%,并且这些内容的访问量异常高,占据了所有网站访问量的80%,也就是我们平常说的符合二八法则。那么可能出现的情况就是大部分的内容评分集中在1分,小部分集中在5分,而中间的2、3、4分的内容分布非常少,其实上图就有点偏向这个趋势,但其实很多时候我们期望的内容分布可以偏向正态,也就是大部分内容能分布在中间分值,两端分值的内容数据相对较少,于是就有了下面的另一种评分模型:

Z标准化评分

  如果你的网站的内容数量很多,那么就可以使用Z标准化(详细描述还是参见数据标准化那篇文章,这里不重复了)。Z标准化的好处是可以让数据呈现正态分布的趋势(不是正是我们想要的吗 :P ),标准化后的数据趋于N(0,1)的正态分布,也就是整体的均值为0,标准差为1。再想想办法让他们变成只是1-5这5个分值,当标准化后的数值:

小于等于-1.5(即-1.5σ)时:1分

大于-1.5(即-1.5σ)小于等于-0.5(即-0.5σ)时:2分

大于-0.5(即-0.5σ)小于0.5(即0.5σ)时:3分

小于等于0.5(即0.5σ)小于1.5(即1.5σ)时:4分

大于等于1.5(即1.5σ)时:5分

  如果数据符合标准正态分布,那每个分值的比例大概是,1分和5分的内容分别占7%,2分和4分的内容分别占23%,3分的内容占40%。我们再来看看用这个方法得到的评分结果的分布情况:

Z-normalization-scoring

  是不是看到你想要的结果了?

3、输出结果

  当然内容评分的展现方式有很多,下面是几个网站的评分截图,其实都不错。 :)

douban-scoring

verycd-scoring

  上面介绍的主要是针对单一指标的内容评分体系,其实在很多情况下内容的评分是诸多指标共同影响的结果,那么内容的评分应该考虑所有这些影响因子,应该构建相应的模型计算内容的综合评分,这里不展开,之后有机会再介绍。

关键指标背后的秘密

secret-of-kpi  前面的一篇文章介绍了可以用来评估KPI的数据上下文——质量控制图,通常我们会用KPI来衡量一些内容的质量、流量的质量,以及访问的质量等,我们经常根据KPI指标直接排序,并认为排在前几名的就是优质的内容,但其实这种方式并不是对所有的KPI都有效。举个最简单的例子:转化率Conversion Rate是很多网站的KPI指标,一般我们会让为Conversion Rate越高则渠道质量越好,或者内容质量越高,但有一种情况,如果网站内容普遍的转化率为10%,但有一个内容的访问次数一共2次,其中有一次实现了成功的转化,那该内容的转化率就是50%,是不是很“高”?是不是真的有这么高?

  所以我们在分析关键指标的变化趋势,控制KPI的质量的时候,还需要注意一个问题,那就是如何运用KPI进行有效的评价

  其实Google Analytics已经给了我们答案,在前段时间推出了Weighted Sort(赋权排序)的功能,Avinash Kaushik先生在先前的博文——End of Dumb Tables in Web Analytics Tools! Hello: Weighted Sort对这个功能做过介绍,因为近段时间需要用到这个功能,但我的数据并不在GA上,所以我必须自己设计一套给关键指标赋权的体系,以发现到底这些KPI值可以达到多少预期,这里来分享下我的应用实例。

KPI期望值公式

  还是以转化率Conversion Rate为例,电子商务中每个商品的转化率应该是:购买该商品成功的数量/该商品被浏览的次数,所以从统计学的角度来看,当商品的浏览次数(不妨叫做基数,数学上的集合元素个数或者统计学上的样本总数)这个基数越大时,转化率CR的置信度也就越高,同样是10%的转化率,浏览次数为1000的商品显然要比浏览次数只有100的商品在转化率这个数值上的可信度要高,统计学上称为“大数定理”。

  根据上面的结论,我们需要根据每个商品转化率的真实值(Actual Value),权衡它的可信度,进而计算得到该商品转化率的期望值(Excepted Value),而这里的可信度就是真实值可以获得的权重,比如60%,那么还有个问题,既然是加权和,另外的40%的权重应该由什么来中和呢?参考GA中Weighted Sort的计算公式,用的是均值,也就是所有转化率的平均,非常不错的idea,于是我们可以得到以下公式了:

期望值(Excepted Value)=权重(Weight)×真实值(Actual Value)+(1-权重)×均值(Average Value)

  我们看看哪些数据我们现在就可以拿到,权重显然还不行,真实值应该已经统计得到了,均值?既然有了所有的真实值,那么均值就是一个取平均的简单计算了。好的,那下面就说说我是如何来确定这个权重的。

权重的确定

  先看看权重需要符合哪些原则,应该表现为怎样的一个特征。显然,权重的取值范围应该在[0,1],也就是0到100%之间;另外,权重跟基数应该是正相关的,也就是基数越大,权重应该越大。如果你看过我之前的文章——数据的标准化,是不是已经想到了什么?是的,里面有几个公式可以直接用,简单地说,就是将基数进行归一化处理。

  KPI的基数一般都是自然数,比如转化率的浏览次数、Bounce Rate的访问数,人均消费的用户数等,所以反正切函数atan不适用,min-max和log函数都适用,可以用散点图简单看一下分别用这两种方法归一化之后权重和基数的变化关系:

Min-max

min-max-plot

  Min-max是直线的正相关,也就是权重和基数同比例地变化,变化速度一直。

Log函数

log-plot

  Log函数是对数曲线的正相关,也就是权重的变化速度要比基数来得快。

  根据这两个方法的特征,我选择了log函数作为权重的计算函数,因为它更符合基数和可信度之间的关系。

应用实例

  既然KPI期望值的计算公式,及公式所有需要的数据都已经可以得到了,那么我们就来看看,KPI的基数是如何影响KPI的期望值的:

log-weight-fit

  即基数越大,期望值越接近真实值,反之,则越接近平均值。算法和公式确定之后,我们就可以将其应用到实际的案例当中去了,这里以网站的转化率CR为例,看看这个KPI期望值的算法是不是有效的。

渠道 进入访问数 转化访问数 真实转化率 权重 期望转化率
渠道1 1534 118 7.69% 79.81% 7.51%
渠道2 9817 641 6.53% 100.00% 6.53%
渠道3 682 43 6.30% 70.99% 6.45%
渠道4 136 11 8.09% 53.45% 7.49%
渠道5 795 69 8.68% 72.65% 8.17%
总计 12964 882 6.80%    

  表格中的例子是用转化率评价每个渠道流量的质量,比对加权前后的转化率情况,可以看到渠道4由于进入的访问数(基数)较小,所以预期的转化并没有真实值反映的那么好,甚至要差于渠道1;而渠道1因为基数较大,其真实转化率基本能够反映现实情况,渠道2因为基数最大,所以期望值就是实际值。

  你也不妨试着用上述的方法转化下你的KPI,发掘一下KPI背后到底隐藏着哪些真相,也许你会发现转化后的结果更加可信,更加能让数据需求方所接受了,那么这个转变就成功了。不要忘了在评论中发表下尝试后的感想,分享下你的使用经历。 

用户综合价值评分体系

user-value-scoring  前面的两篇文章介绍了基于点击流数据的适合所有网站的用户忠诚度分析及应用于电子商务网站的用户分析,并且通过雷达图可以直观的展示用户在各指标上的表现情况,我们可以通过雷达图上图形围成的面积来简单评价一个用户的综合价值。可能大家都有这样的疑问,当各指标的影响权重不同时(比如电子商务网站可能会更看重用户完成的订单数或者在一段时间内的交易额),在这种情况下我们该如何来评价用户的综合价值?如果你看过我的上一篇文章——层次分析法(AHP),相信你已经找到了满意的答案,是的,层次分析法可以很好地解决这个问题。下面就用层次分析法分别介绍一下用户忠诚度评价及电子商务网站用户的综合价值评分:

评价用户忠诚度

  用户忠诚度由4个指标——用户访问频率、最近访问时间、平均停留时间和平均浏览页面数决定,这4个指标没有明显的类别划分,并且可以认为是在同一层次上的相互独立的指标,所以只需要构建2层的模型:

AHP-model-for-user-loyalty

  我们需要计算底层每个指标对用户忠诚度的影响权重,只需要知道底层各指标间的相对比重,这个主要通过专家组或者问卷调研的方法获得数据,这里假设4个指标间两两比较的比重如下表(使用9标度):

  用户访问频率 最近访问时间 平均停留时间 平均浏览页面数
用户访问频率 1 7 3 3
最近访问时间 1/7 1 1/3 1/5
平均停留时间 1/3 3 1 1/3
平均浏览页面数 1/3 5 3 1

——表格中的数据是一个正互反矩阵,即如果“用户访问频率”与“最近访问时间”的比重为7(1-9标度的定义参见层次分析法那篇文章),则对应的表格(第2行第3列)的数值为7,矩阵对角线对称的表格(第3行第2列)的值为1/7。所以两两比较只需要完成对角线一侧的数据,另一侧取对应数值的倒数就可以了。

  因为指标间进行的是两两比较,所以整个矩阵的数据会存在不一致性,比如上表中的数据“用户访问频率”和“平均停留时间”、“平均浏览页面数”的比重都是3,那么一次应该推断“平均停留时间”和“平均浏览页面数”的比重应该是1,也就是同等重要,但是下面该比重的实际数据是1/3。所以可以看到两两比较的过程只在乎两个指标的关系,不存在推导关系,这样就会导致整个矩阵存在不一致性,在计算权重前需要验证矩阵的不一致性系数,只有小于0.1时,该矩阵的数据才能被采纳。

  根据表中两两比较的结果可以通过层次分析法的矩阵运算计算各指标的权重,如果你对excel足够熟悉的话在excel里面也可以实现,这里推荐使用AHP的分析工具——Expert Choice,在这个工具里面只要构建类似上面的树状模型,然后将上表的指标两两比较的结果输入进去,软件就会自动计算出各指标相对于目标的权重及整个模型的CR(一致性概率)。导入上面的模型,输入表格中指标两两比较数据,通过软件计算得出的CR=0.05<0.1,所以数据通过检验,可以进一步获取各指标的权重,得到以下的加权加权计算公式:

  用户忠诚度=用户访问频率*0.525+最近访问时间*0.056+平均停留时间*0.139+平均浏览页面数*0.279

  基于该结果,我们可以将标准化后的用户每个指标的评分数据进行加权求和,还是以网站用户忠诚度分析一文中的两个用户为例,采用的是10分值的评分体系,则计算用户的忠诚度如下:

评分 用户访问频率 最近访问时间 平均停留时间 平均浏览页面数 用户忠诚度
用户1 1.0 5.0 3.0 3.8 2.28
用户2 4.0 9.3 2.4 6.3 4.71
用户n …… …… …… …… ……

  通过上述的层次分析法,将多个评价指标的评分结果加权汇总到一个目标指标,有利于更直接地评价用户,通过上述结果可以算出每个网站用户的忠诚度评分,可以直接排序选择忠诚度排名靠前的用户展开定向营销。

评价电子商务网站用户的综合价值 

  通过上面的分析实例,大家对层次分析的应用应该有了一定的熟悉,那么对于更加复杂的多层次分析模型,层次分析法又是如何实现的呢?下面就以电子商务网站用户分析这篇文章中的指标体系为例来简要介绍下。首先也是构建评价指标体系模型,从电子商务的交易数据中获取的指标更为丰富,我们根据文中对指标的阐述,将指标进一步分层,可以建立起3层结构的模型,如下图:

AHP-model-for-E-commerce-user

  基于这个模型,需要使用3次AHP来计算:

  1. 忠诚度和消费能力对用户价值的影响权重;
  2. 最近购买时间、购买频率和购买产品种类对忠诚度的影响权重;
  3. 平均每次消费额和单次最高消费额对消费能力的影响权重。

  分别在每一步中获取指标两两比较的权重,计算矩阵的一致性概率CR,若通过则计算获得每个指标对上层相应指标的影响权重系数,最终我们可以得到类似如下的结果:

  用户价值=忠诚度*0.67+消费能力*0.33

  忠诚度=最近购买时间*0.12+购买频率*0.64+购买产品种类*0.24

  消费能力=平均每次消费额*0.67+单词最高消费额*0.33

则可以推导的出用户价值的直接计算公式:

  用户价值=(最近购买时间*0.12+购买频率*0.64+购买产品种类*0.24)*0.67+(平均每次消费额*0.67+单词最高消费额*0.33)*0.33  →

  用户价值=最近购买时间*0.08+购买频率*0.43+购买产品种类*0.16+平均每次消费额*0.22+单词最高消费额*0.11

  还是用文中例举的两个用户为例来计算他们的综合价值评分,如下表:

评分 最近购买时间 购买频率 购买产品种类 平均每次消费额 单词最高消费额 忠诚度 消费能力 用户价值
用户1 2 3 3 8 9 2.88 8.33 4.68
用户2 7 7 8 6 5 7.24 5.67 6.72
用户n …… …… …… …… …… …… …… ……

  从上表可以看出,在运用层次分析法获得的分析结果中,不仅能够计算出最终的目标指标(用户价值)的评分,同时也能够计算得到模型的中间层指标(忠诚度和消费能力)的评分,这样我们不仅能够通过直接比较用户的综合价值评分获取网站的重要用户,同时忠诚度和消费能力的评分也为针对用户的细分提供了一个有力的量化数值参考依据,如下图:

E-commerce-user-value-plot

——100个随机样本数据的散点分布,图中的数据仅供参考,不代表任何网站的实际情况

  上面的散点图是对用户忠诚度和消费能力的一个简单展示,从图中点的聚集情况(或者点分布的密集度)可以将图简单分成4块,满足各分块内部的各点间距离最短(最密集)及各分块间的点分布距离最长(最离散),其实可以看做是一个最简单的聚类,从中可以看出电子商务网站用户特征的分布情况:

  • 从C区域可以看出用户较多地分布在忠诚度和消费能力评分为3附近的区域,也是网站最普遍的客户群;
  • B区域的用户是网站的最有价值客户(VIP),但是数量相当稀少,可能不到10%;
  • 在A区域有一个点密集区间(忠诚度1-2、消费能力8-9),可以认为是网站的高级消费用户群,他们消费不多,但消费额很高,如果你的网站提供高级消费品、批发、团购等服务的话,那么他们就可能是那方面的客户群;
  • D区域的用户虽然消费能力也不强,但他们是你的网站的忠实Fans,不要忽视这些用户,他们往往是网站线下营销和品牌口碑传播的有利拥护者。

  通过类似上面的分析过程,我们可以发现电子商务网站用户的某些特征,为网站的运营方向和营销策略提供一定的决策支持。

  这篇文章里面主要讨论的是运用层次分析法对网站用户的一个评价应用案例,其实层次分析法不仅适用于网站用户的评价,同样适用于网站页面、产品、来源、关键词及其它任何牵涉多指标可分层的评价,关键在于如何建立起一套系统的有效的指标评价体系。如果你有更好的扩展思路,欢迎与我评论交流。

电子商务网站用户分析

user-importance  前一篇文章主要是基于点击流数据的用户分析,适合所有网站,而对于一些特殊的网站,可以根据自身所能获取的数据将分析的指标进行扩展或根据自身的特征定制合适的指标,这里主要介绍的是适合一般的电子商务网站的用户分析方法。

  当用户在电子商务网站上有了购买行为之后,就从潜在客户变成了网站的价值客户。电子商务网站一般都会将用户的交易信息,包括购买时间、购买商品、购买数量、支付金额等信息保存在自己的数据库里面,所以对于这些用户,我们可以基于网站的运营数据对他们的交易行为进行分析,以估计每位用户的价值,及针对每位用户的扩展营销(Lead Generation)的可能性。

评价用户价值的指标

  对于评价指标的选择这里遵循3个原则:

  • 指标可量化:没办法,要做定量分析,这个是最基本的前提;
  • 尽可能全面:根据底层数据选择尽可能多的可以获取的指标,这样能够从多角度进行分析和评价;
  • 线性独立:即指标间尽量保持不相关。比如如果选择用户的购买次数和总消费额,那么一定是购买次数越多的用户总消费额越高,也就是导致了评价维度上的重合,而选择购买次数和平均每次交易额可以避免这种相关性产生的弊端。

  根据以上几个原则选取了以下几个指标(同样根据网站的特征选取合适的统计时间段):

  1. 最近购买时间:用户最近一次购买距当前的天数;
  2. 购买频率:用户在这段时间内购买的次数;
  3. 平均每次交易额:用户在这段时间内的消费总额/购买的次数;
  4. 单次最高交易额:用户在这段时间内购买的单词最高支付金额;
  5. 购买商品种类:用户在这段时间内购买的商品种类或商品大类。

用户评价模型的展示

  一样的,也可以用雷达图进行展示,同样也使用离差标准化的方法对每个指标进行消除度量单位的10分制评分。这里具体的方法就不再重复介绍了,请参照——网站用户忠诚度分析这篇文章。下面是一个雷达图的示例:

E-Commerce-user-RadarChart

  通过这个雷达图,我们可以读到比用户忠诚度更多的信息。图中的上面3个指标——最近购买时间、购买频率和购买商品种类可以用来评价用户的忠诚度,而下面的2个指标——平均每次交易额和单词最高交易额可以用来衡量用户的消费能力。如上图,用户1虽然购买频率和购买的广度不高,但其消费的能力较强,而用户2是频繁购买用户,对网站有一定的忠诚度,但其消费能力一般。所以图形的上半部分面积较大的用户拥有较高的忠诚度,而下半部分面积较大的用户具有更高的消费能力。这两类用户都是网站的有价值客户,但由于其类型的不同,在营销策略上可以分开对待。

用户交易行为分析的意义

  • 发现网站的高价值客户(VIP),为客户关系管理(CRM)及保持有价值客户提供支持;
  • 发掘网站的可发展用户,对于一些新客户或潜力客户进行针对性营销;
  • 及时发现可能流失的客户,及时采取有效措施;
  • 根据用户交易行为细分客户群,实施有针对性的营销策略。

网站用户忠诚度分析

user-loyalty-analysis  忠诚用户不仅能为网站创造持续的价值,同时也是网站品牌口碑推广的重要渠道,所以目前网站对忠诚用户愈加重视。可能很多网站或者网站分析工具对用户做了“新用户”和“回访用户”的划分,但是单单区分新老用户是不够了,我们需要更加完善的指标来衡量网站用户的忠诚度。

  用户忠诚度(Loyalty),指的是用户出于对企业或品牌的偏好而经常性重复购买的程度。对于网站来说,用户忠诚度则是用户出于对网站的功能或偏好而经常访问该网站的行为。根据客户忠诚理论,忠诚度可以由以下4个指标来度量:

  • 重复购买意向(Repurchase Intention:购买以前购买过的类型产品的意愿;
  • 交叉购买意向(Cross-buying Intention:购买以前为购买的产品类型或扩展服务的意愿;
  • 客户推荐意向(Customer Reference Intention:向其他潜在客户推荐,传递品牌口碑的意愿;
  • 价格忍耐力(Price Tolerance:客户愿意支付的最高价格。

量化网站的用户忠诚度

  以上的4个指标对于电子商务网站而言,可能还有适用性,但对于大多数网站是不合适的,所以为了让分析具有普遍的适用性,同时为了满足所有的指标都可以量化(上面的客户推荐意向比较难以量化),以便进行定量分析的要求,这里可以选取Google Analytics中对用户忠诚度的4个度量指标:Repeated Times、Recency、Length of Visit、Depth of Visit,即用户访问频率、最近访问时间、平均停留时间、平均访问页面数,这些指标可以直接从网站的点击流数据中计算得到,对所有的网站都适用,下面看一下这些指标的定义及如何计算得到(一些网站度量的相关定义请参考——网站分析的基本度量):

  • 访问频率:用户在一段时间内访问网站的次数,即每个用户Visits的个数;
  • 最近访问时间:用户最近访问网站的时间,因为这个指标是个时间点的概念,所以为了便于度量,一般取用户最近访问时间距当前的天数。
  • 平均停留时间:用户一段时间内每次访问的平均停留时间,即每个用户Time on Site的和/Visits的个数;
  • 平均访问页面数:用户一段时间内每次访问的平均浏览页面数,即每个用户Page Views的和/ Visits的个数。

  统计数据的时间区间也是根据网站的特征来定的,如果网站的信息更新较快,用户访问较为频繁,那么可以适当选取较短的时间段,这样数据变化上的灵敏度会高些;反之,则选择稍长的时间段,这样用户的数据更为丰富,指标的分析结果也会更加准确有效。

用户忠诚度的展示和比较

  上面的4个指标均可以被量化统计得到,单一的指标也是没有意义的,我们需要通过比较来找出哪些是忠诚用户,哪些是流失用户,可以先对指标进行一些处理,以便使它们之间更具可比性,可以参考之前的文章——数据的标准化),这里我采用的是min-max标准化的方法,首先将所有指标的数值全部转换到[0,1]区间,再进行倍数放大,比如使用10分制进行评分,则可以乘10,数据就全部分布在[0,10]区间内了,如下图:

    访问频率 最近访问时间 平均停留时间 平均访问页面
用户1 数据 2次 15天前 150秒 3页
标准化 0.10 0.50 0.30 0.38
评分 1 5 3 3.8
用户2 数据 8次 2天前 120秒 5页
标准化 0.40 0.93 0.24 0.63
评分 4 9.3 2.4 6.3

——表中的数据只是简单的举例,实际情况需要根据每个指标的最大最小值进行计算

  根据上表的数据,我们已经将所有指标统一到了同一个评分区间,那么就可以使用雷达图对用户的忠诚度进行展示。用雷达图展示有以下几个优点:

  • 可以完整地显示所有评价指标;
  • 显示用户在各指标评分中的偏向性;
  • 可以简单分析用户忠诚度的综合评分,即图形围成的面积(假设四个指标的权重相等,若重要程度存在明显差异,则不能用的面积来衡量);
  • 可以用于用户间忠诚度的比较。

  下面是根据上表绘制的雷达图示例:

user-loyalty-RadarChart

用户忠诚度分析的意义

  那么基于这个展示的结果我们能做些什么呢?其实对于任何网站而言,有两个方向是一致的:保留忠诚用户减少流失用户。基于上面的用户忠诚度评价体系扩展开来就是:

  1. 分析忠诚用户的行为特征,努力满足他们的需求,提高他们的满意度;
  2. 从最近访问时间的指标数据机用户忠诚度变化趋势中发现一些可能正在流失的用户,分析他们流失的可能原因,并试图挽留流失用户;
  3. 比较忠诚用户和流失用户在指标数值上的差异,寻找哪些指标的差距导致了用户忠诚度的降低,优化网站在这些方面的表现。

  所以,我这里使用的是基于用户访问频率、最近访问时间、平均停留时间、平均访问页面数这4个指标来评价网站用户的忠诚度,并用雷达图进行展示和比较,也许你可以根据自己网站的特征找到更加适合的指标和展示方式,而最终需要做的是能够更加精确地找到网站的忠实用户,并努力留住他们。

数据的标准化

  数据的标准化(normalization)是将数据按比例缩放,使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。

  其中最典型的就是数据的归一化处理,即将数据统一映射到[0,1]区间上,常见的数据归一化的方法有:

min-max标准化(Min-max normalization)

  也叫离差标准化,是对原始数据的线性变换,使结果落到[0,1]区间,转换函数如下:

  其中max为样本数据的最大值,min为样本数据的最小值。这种方法有一个缺陷就是当有新数据加入时,可能导致max和min的变化,需要重新定义。

log函数转换

  通过以10为底的log函数转换的方法同样可以实现归一下,具体方法如下:

  看了下网上很多介绍都是x*=log10(x),其实是有问题的,这个结果并非一定落到[0,1]区间上,应该还要除以log10(max),max为样本数据最大值,并且所有的数据都要大于等于1。

atan函数转换

  用反正切函数也可以实现数据的归一化:

  使用这个方法需要注意的是如果想映射的区间为[0,1],则数据都应该大于等于0,小于0的数据将被映射到[-1,0]区间上。

  而并非所有数据标准化的结果都映射到[0,1]区间上,其中最常见的标准化方法就是Z标准化,也是SPSS中最为常用的标准化方法:

z-score 标准化(zero-mean normalization)

  也叫标准差标准化,经过处理的数据符合标准正态分布,即均值为0,标准差为1,其转化函数为:

  其中μ为所有样本数据的均值,σ为所有样本数据的标准差。