标签归档:用户分析

怎样合理地定义用户流失

user_churn  很久没有更新博客了,这篇再写一些关于“用户流失”的内容。之前发布的网站的活跃用户与流失用户这篇文章对网站的活跃用户流失用户新用户流失做了定义,这里修正下对流失用户的英文叫法,一般对流失用户常用的英文为“churn user”,之前用的wastage、away、lost等都不是太规范。后来陆续有做相关分析的朋友问到流失用户的流失时间长度到底选择多长是合理的,尤其是《网站分析实战》这本书出版之后,我在里面有提到如何更准确地定义流失的时间长度,可能解释的比较简单,还是有朋友留言反馈这方面的问题,所以这里再用一篇文章解释一下。

流失用户与回访用户

  流失用户的定义请参考“网站的活跃用户与流失用户”这篇文章,要解释怎么样合理地去定义用户流失时间段长度的问题,需要先介绍一个新的指标概念:回访用户。这里的回访用户不是指Google Analytics上面的Returning Visitor(与新用户相对,指之前访问过网站的用户再次访问网站),这里的回访用户指流失之后再次访问网站的用户,即用户曾经流失过,满足流失时间期限内完全没有访问/登录网站的条件,但之后重新访问/登录网站。然后,根据回访用户数可以计算得到用户回访率,即:

  用户回访率 = 回访用户数 ÷ 流失用户数 × 100%

  回访用户率的数值大小间接地可以验证对用户流失定义的合理性。正常情况下,用户的回访率应该是比较低的,从业务的角度考虑,如果对流失的定义是合理的,那么很难让那些对你的网站已经失去兴趣的用户重新来访问你的网站。一般情况下,网站的用户回访率应该在10%以下,在5%左右的数值是比较合理的,对于成熟的网站而言用户回访率会稍高,而新兴的网站的用户回访率通常更低,尤其像手机APP这类用户易流失的产品。

流失期限与用户回访率

  用户流失的流失期限的长度与用户的回访率成反比,我们在定义用户流失时使用的连续不访问/登录网站的期限越长,这批流失用户之后回访网站的概率就会越低,并且随着定义的流失期限的增大,用户回访率一定是递减的,并逐渐趋近于0。那么如果选择合适的流失期间长度?我们可以设定不同的流失期限长度,进一步统计每个流失期限的用户回访率,并观察用户回访率随定义的流失期限增大时的收敛速度。如果以“周”为单位设定流失期限:

user_returning_rate

  根据设定的不同流失周期的用户回访率的变化曲线,我们可以使用拐点理论(Elbow Method)选择最合适的流失周期。

  拐点理论:X轴上数值的增加会带来Y轴数值大幅增益(减益),直到超过某个点之后,当X增加时Y的数据增益(减益)大幅下降,即经济学里面的边际收益的大幅减少,那个点就是图表中的“拐点”。比如上图中流失周期增加到5周的时候,用户回访率的缩减速度明显下降,所以这里的5周就是拐点,我们可以用5周作为定义用户流失的期限,即一个之前访问/登录过的用户,如果之后连续5周都没有访问/登录,则定义该用户流失。

  所以,有个这个办法之后,就能更加合理地定义流失用户的统计逻辑,而之前要做的就是选择不同的流失期限分别计算用户的回访率,然后用统计的到的数值生成如上的一张带平滑线的散点图,问题就迎刃而解。 :)

不得不考虑的时间因素

Mechanical-Clock  在网站数据分析中,时间是最常见也是最不可或缺的维度之一,大部分情况下用于限定指标统计的范围和粒度,同时时间因素也会对指标的一些统计规则和细节造成影响,而在某些数据分析中我们很容易忽略时间因素的影响,这些影响可能误导最终的结论。

  发现这个问题是在一个数据提取的需求中,网站每天会发布很多新的内容,这些新的内容需要进行推荐,不然就会被埋没,所以很多网站都会有“最新推荐”之类的模块,而这个数据需求就是分析应该推荐哪些新内容?网站新发的内容质量参差不齐,而且数据积累较少,而推荐模块需要放置那些有潜力的新内容,以便潜力充分发掘后成长为热门内容,所以数据分析要做的就是去寻找那些有潜力的新发内容。如果是TOP10的推荐榜单,最简单的做法就是根据新内容的访问量或者转化率进行排序选前十,但其中有很多值得注意的地方,关于转化率需要注意的地方可以参考关键指标背后的秘密这篇文章,这里主要讨论如果以内容的访问量进行排序,如果选择近一周的汇总数据,我们需要注意什么?也许你已经想到了,之所以这里举例新内容,是因为新内容有一个发布时间(Publish Time),就像一个人的出生日期,而从发布时间到当前的时间间隔就是内容的持续时间,也可以认为是内容的生命期(Lifetime),就像一个人的年龄。内容的持续时间越长就获得越多的数据积累,相应获得高访问量的机会就越大,如果我们比较一周中在不同时间发布的内容在该周的总访问量,那些就会掉入错位比较的陷阱,或者叫“Mismatch”。

Unfair-Fight  一个形象的比喻就是刚刚入伍的新兵跟久经沙场的老将的决斗,虽然新兵不是完全没有胜出的机会,也许那个新兵天生勇猛,或者有着一股初生牛犊不怕虎的冲劲,可以一举击败经验丰富的老将,但在大多数情况下这种可能性较小,这是一场不公平的决斗,而在数据分析中我们需要尽量去避免这类不公平的决斗(比较)。

内容和商品分析

  其实日常中发生这类错误的情况可能很普遍,当我在博客新发文章几天后上Google Analytics去看数据,发现新文章页在相对较后面的位置,不是因为真的没人看,而是GA上默认展现近一个月的汇总数据,报表根据Pageviews排序的结果新内容无法在短时间内迅速冲到前几位。对于那些新发内容或者新上架产品频率不高的网站,运营人员可能比较清楚哪些是新内容,所以通过一些人为的辨认调节在分析的时候不易掉入陷阱,但对于每周有上百个新发内容的网站,这类错误的发生很可能埋没一些优质的新品。

  我们需要找到一些办法去规避这个时间因素对分析结果的影响,通常我们在选择比较对象的时候需要控制所有的比较对象具备相同的持续时长,比如我们比较新内容的热门度,统一选择近一周的数据,对于较早发布的内容摒弃之前的数据,而近一周内刚发布的内容则舍弃不参与这次比较,等到有了完整的一周数据之后再加入比较。这样虽然可以确保比较在同一基准线上,但无疑延后了评估的结论,对于某些一上来就表现抢眼的内容无法及时发现,于是这里采用统计单位时间指标表现的方法,即根据内容的发布时间统计得到每个内容的持续时间(一般精确到天即可),然后将内容的总体访问量除以这个持续时间,就得到了单位时间的内容访问量,进而进行比较:

Contents-visits-sort-table

  上表取的是5个新发布内容近10天的访问量数据,同时加入了内容自发布以来的持续天数,我们用总的访问量除以持续天数计算得到平均每天访问量,然后以总访问量和平均每天访问量分别进行降序排列,得到完全不一样的排名。如果按排序1,我们完全可能忽略D内容的强劲表现,而权衡时间因素之后的排序让我们能够更加准确的把握有潜力的新内容。

  以上的方法同样适用于电子商务网站的商品分析,很多电商网站希望在新商品中挑选有足够潜力的商品进行重点营销,用于打造所谓的“爆款”,从而进一步促进订单量的增长提升销售额和利润。对有潜力新品的挑选一方面需要足够敏锐的嗅觉和眼光,另一方面就要借助数据分析,而这个时候不得不考虑上面提到的时间因素的影响,记住一个月内销售20件的商品不一定比销售50件的差,关键在于这些商品你是何时上架的,使用有效的方法进行评估才能找到真正有潜力有价值增长点的商品。

  要知道任何的网站内容或产品都不是经久不衰的,都有它们自己的生命周期,所以明智的网站运营永远在不断寻找新的生长点,如果数据分析中欠缺考虑时间因素,那些有潜力的产品和内容很可能就会被“久经磨练”的产品内容长期压制,导致网站新陈代谢过于缓慢,进而落后于其他网站。

用户分析

  在进行用户分析的时候,同样需要注意时间因素,如用户RFM分析用户忠诚度价值评分用户生命周期价值等,这些基于用户在一段时间内持续性行为分析的模型都易掉入时间的陷阱。我们没法奢求一个只注册了一周的新用户在近一个月的访问频率高于老用户,因为你只给了他7天的时间,而与他对决的是拥有充裕的30天时间的用户;同样你不应该去比较一个仅使用一个月的新用户与一个一直在持续使用的老用户在三个月或半年中的消费次数、消费金额等,因为他们不在同一起跑线上。但新用户拥有潜力,指不定他们就会成长为更加高价值的忠诚用户,所以在针对用户的营销中我们需要消除这个因素的影响,同样使用除以用户使用网站持续时间(从用户首次访问或者注册时间开始计算)的方法计算单位时间的指标表现,使用RFM模型看下考虑时间因素前后对用户评估的差异:

RFM-with-duration-table

  如上表所示,假如RFM模型选择了近100天的数据来对用户进行分析,这里同样加入“持续时间”这个统计量,即用户从注册到当前的天数,如果用户的注册时间在100天之前,那么用户在该统计周期中的持续时间就是100天(最大期限)。RFM的三个指标中的最近购买间隔(R)不受用户持续时间的影响,因此在考虑时间因素时不用做变换,而购买频率(F)和消费金额(M)都会受到持续时间的影响,需要除以持续时间,计算得到单位时间(这里是天)的数值,即表格中每位用户在“是否考虑时间因素”前后的指标变换。从变换前后的比较来看,用户1因为是持续使用的老用户,未考虑时间因素前在购买频率和消费金额上具有明显优势,但数据变换之后,用户2所表现的粘性和价值更高,即用户2虽然使用网站时间不长,但在单位时间的购买消费上优于用户1,我们通过雷达图进一步看下考虑时间因素前后的效果:

RFM-with-duration-radar

  图中对数据进行标准化评分后,蓝线代表用户1,红线代表用户2,虚线表示未考虑时间因素,实现代表考虑了时间因素,可以看到用户2在考虑时间因素之后价值被明显放大,从图中可以得到用户2的预期价值优于用户1。如果我们不去考虑时间因素的影响,分析的结果就会产生明显的偏差,进而可能误导对用户的正确评估。

  其实这里提及的时间因素还是一个遵循对比原则的问题,比较的对象之间必须具备可比性,不然比较的结果就没有任何的意义

  很久没有更新博客了,因为这段时间的变动没有时间去思考和整理一些新的内容。这篇文章中提及的分析中需要考虑到的时间因素其实在很多情况下都遇到过,尤其是对一个时间周期内汇总的统计指标做细分分析的时候需要格外注意各细分项存在的时间周期是否一致,希望对大家有所启发和帮助。

基于用户细分的比较分析

Pizza  从网站的用户层面,我们根据用户访问的行为特征将用户细分成各种类型,因为用户行为各异,行为统计指标各异,分析的角度各异,所以如果要对用户做细分,可以从很多角度根据各种规则实现各种不同的分类,看到过有些数据分析报告做了各种用户的细分,各种用户行为的分析,再结合其他各种维度,看上去内容绝对足够丰富,但很难理解这些分析结果到底是为了说明什么问题,也许作为一个咨询报告反映当前整体的趋势和用户特征确实合适,但如果真的要让数据分析的结果能够引导我们去做些什么,还是要在做用户细分前确定分析的目的,明确业务层面的需求。

  既然要做基于用户细分的比较分析,自然是为了明确某些用户分类群体的行为特征与其他用户群体的差异。这里主要从指导内容层面的调整为导向,通过比较各用户细分群体对内容需求的差异,优化内容运营,将优质的内容或者符合用户偏好的内容推荐给相应的用户。

  既然是基于用户细分,首先明确用户的细分规则,这里举例3类细分:流失用户与留存用户、新用户与老用户、单次购买用户和二次购买用户,基于这3类细分,对每个分类的用户购买商品进行比较分析,明确哪些商品更加符合用户的预期。

流失用户和留存用户比较

  当然,要区分流失用户和留存用户,首先必须对用户流失有一个明确的定义,关于流失用户的定义可以参考博客之前的文章——网站的活跃用户与流失用户。有了定义我们就可以做统计和细分了,还是以电子商务网站为例,电商网站的内容就是商品,我们基于每个商品计算购买这些商品的用户中购买后造成流失的用户比例,如下:

away-remain-comparison

  这里的指标定义应该比较明确,每个商品的流失用户比例应该是购买该商品后流失的用户数在所有购买该商品的用户中的占比,但只知道每个商品的流失用户比例无法评价这个商品是否对用户保留有促进作用,或者在一定程度上造成了用户的流失,只有通过与总体水平的比较才能得出相应的结论。所以这里需要重点解释的是“与总体比较”这个数值是怎么计算的到的,这里的百分比不是直接相减的结果,而是一个差异的幅度体现,这里假设总体用户流失率为56%,那么以A商品为例,与总体比较的结果是:( 58.13% – 56% ) / 56% = 3.80% ,使用同样的计算方法也可以得到其他商品与总体比较的差异幅度。最后就是展示,在Excel里面通过“条件格式”里面的数据条功能可以直接展现出图中的效果,非常方便。

  很明显,上面图中的分析结果对运营调整有直接的指导性,目的是促进用户保留,所以我们要做的就是将有利于用户留存的商品(F商品的用户流失率明显要比总体低得多,说明F产品更有利于用户保留)推荐给用户,而将那些可能导致用户流失的商品(C商品)进行优化或者下架。

新用户和老用户比较

  同样,使用上面的方法可以区分不同用户群的购买偏向。新老用户的细分是最常见的用户细分方法,我们可以使用类似的方法来看看新老用户对商品的不同喜好:

new-return-comparison

  从上图中你看出了什么?购买D商品的用户中新用户的比例明显偏低,也许新用户根本就不喜欢这个商品,而B商品和F商品显然更加符合新用户的口味。如果你的网站可以进行新老用户区分的定向推广,那么上面这个分析结果将让你受益良多。

  当然,这个数据呈现的特征可能跟商品的推广渠道有一定的关系,比如上图的D商品比较多的是使用老用户比较集中的推广渠道(比如EDM),那么自然购买用户中老用户的比例会偏高;或者把某些商品放在新用户比较集中的Landing Page中展示,那么购买该商品的新用户比例也显然会偏高。所以,在做诸如此类的分析时需要注意根据推广渠道的差异,具体问题具体分析,不能一概而论。

单次购买用户和二次购买用户比较

  使用同样的方法也可以促成用户的多次购买。对于电子商务网站而言,用户的首次购物体验非常重要,这将会直接影响用户是不是会产生再次或者之后的多次购买,或者是否能够成为网站的忠诚客户。如果你的网站注重用户关系管理,那么你可以尝试下使用下面的分析方法:

once-repeat-comparison

  需要注意的是这里的基础用户群设定在了每个商品的首次购买用户(不是所有),我们要分析的是所有将该商品作为首次购买商品的情况下,用户是否还会发起之后的再次甚至多次购买行为,从而评价商品对于首次购买体验的影响好坏。从上表可以看出,B商品和F商品在促成二次购买的表现不佳,很有可能商品的使用或质量问题影响了用户的满意度,阻碍了用户再次购买的脚步。根据分析结果,我们尤其需要对那些二次购买率比总体水平低非常多的商品进行重点关注,同时也需要根据商品的特征进行分析,有些商品确实比较容易促成二次购买,因为可能存在交叉销售和向上营销的情况。

  其实本来想把这篇文章拆分成多篇整成一个系列专题,因为从实现层面而言,每一块的用户细分的分析都需要独立完成,而且大部分要从底层的数据计算得到,如果你从Google Analytics上面从寻找类似的数据,其实唯一可以找到的就只有新访问比例,而且在内容模块里面细分到每个页面的指标也未包含% New Visits(在流量来源、地域细分里面有该度量),当然你可以自定义报告来查看网站每个页面的新访问比例,比较的基准还是网站总体的新访问比例,GA的展现方式选择里面直接提供了与总体比较的视图“Comparison”,下图是我做的自定义报表:

GA-page-newvisits

  GA上面的展现的效果跟用Excel 2010上面定制条件格式后的效果很像(2010可以展现正负值在坐标轴左右侧区分的红绿数据条,2007貌似还未实现此功能),这种基于基准的比较展现非常直观使用,其实在其它的分析中同样可以用到。那么你从我的博客的各内容新用户比例比较分析中看出了什么?访问数排在前几名的文章中很明显的趋势就是概念性方法论的文章新用户比例高于均值(当然主要靠搜索引擎的帮忙),而观点性和分析性的文章的新用户比例低于均值(老用户更偏向于实践和应用 ;)  ),所以如果我的博客可以动态向新用户和老用户展现不同的内容,那么这个分析将十分具有价值,也许你的网站可以尝试下。

  最后还是回到一开始的问题,需要总结的是:细分是用于比较的,比较是为了反映差异进而做出调整优化的,所以细分的目的最终还是指导运营决策,这个才是数据分析的价值体现。

值得关注的用户指标

focus-metrics  最近最常被问到的就是一些用户的统计指标,无论是决策层还是产品部门,所以这篇文章重点说下用户指标的一些内容。

  假设你想用尽量简洁有效的数据了解一个网站或产品的用户情况,你会问哪几个用户数据?其实一个聪明的提问者永远不会问网站的累计用户数有多少,甚至不会问网站的UV是多少,因为这些指标都不能从真正意义上去反映网站的价值和发展状况。

  举个简单的例子——网秦,累计用户数应该不下千万,但这个数字真的能够体现网秦所具备的价值吗?按照网秦的这种运营推广模式,真正的活跃用户有多少,所占比例如何?3·15之后,流失用户又有多少,这个流失率是不是足以让网秦先前辛辛苦苦培养起来的用户基础毁于一旦?所以网秦的发展前景又如何?其实我们可以使用一些更有说服力的用户指标来反映这些情况。

用户的细分方式

  我不建议把用户细分成许许多多的类型,目前为止见过的用户细分的类别也不在少数,罗列出来应该有一大串:当前用户、新老用户、活跃用户、流失用户、留存用户、回访用户、误闯用户、休眠用户、常驻用户、忠诚用户……其实很多的定义或含义是相近的,在分析层面也扮演着类似的指标角色。所以不建议将用户这样混乱无章地分成N个类别,用户的细分关键在于以合理的体系将用户细分成几个类别,并且每个类别都能发挥其在用户分析上的功效,不存在累赘和混淆

  所以这里想介绍下我认为比较合理的用户细分方式。我将用户分成以下几类:当前使用用户新用户活跃用户流失用户回访用户,下面来简单的解释下。

  当前使用用户:即我们平常所说的UV,也就是网站的登录或者使用用户数。用于体现网站的当前运营状况。

  新用户:首次访问或者刚刚注册的用户;那么那些不是首次来访的用户就是老用户,于是同时也获得了老用户的统计。用于分析网站的推广效果或者成长空间。

  活跃用户数:活跃用户的定义千差万别,一般定义有关键动作或者行为达到某个要求时的用户为活跃用户;每个网站应该根据自身的产品特定定义活跃用户。活跃用户用于分析网站真正掌握了多少有价值用户。

  流失用户网站的活跃用户与流失用户中已经做了定义和介绍,用于分析网站保留用户的能力。我们将那些未流失的用户叫做留存用户,可以通过总使用用户数减去流失用户数计算得到。

  回访用户:是指那些之前已经流失,但之后又重新访问你的网站的用户。用于分析网站对挽回流失用户的能力(常常会受到那些很久没有登录的网站给你发的邮件吧,让你回去看看,这些措施就是他们在挽留那些流失用户)。除非近期内执行了一些挽留流失用户的手段,正常情况下回访用户的比例应该是比较低的,否则就是你对流失用户的定义不够准确,应该适当延长定义流失的时间间隔。

  所以其实在我们获得某些用户统计指标之后,通过计算同时也获得了诸如老用户、留存用户这些指标。

值得关注的用户指标

  文章的开头已经提到过,如果你想了解一个网站或者一个产品的用户情况,请尽量抓住那些最为关键的用户指标。如果是我来问,我只会问3个指标:活跃用户数新用户比例用户流失率

  显而易见,活跃用户数直接反映了网站或者产品真正掌握着多少用户,这些用户并不是因为某些广告或者链接误点进来的,而是真正对这个网站或者产品感兴趣,有意向去使用或者持续关注的。活跃用户数越高,网站或者产品当前拥有的价值越高。但这里有一点需要格外注意,那就是活跃用户的定义,活跃用户跟新用户不一样,活跃用户可能催生各种形形色色的定义,之前的文章——用Engagement衡量用户活跃度对于如何定义用户活跃做过介绍,活跃用户的定义也类似,可以有各种方法。宽松的定义可以让活跃用户“变多”,比如只要访问页面数超过2页或者停留时间超过30秒;而严谨的定义可能会导致活跃用户“减少”,比如微博网站定义平均每天发送微博数量超过2条的才是活跃用户。所以,不同的定义影响着活跃用户的数量,当你问到活跃用户时,一定要了解对方是如何定义活跃用户的。我更偏向于严谨的定义,虽然这会让活跃用户“减少”,但严谨的定义让数据显得更加真实,可以说根据这个定义统计到的用户是那些真正在为网站创造价值的用户。

  新用户比例反映着网站或产品的推广能力,渠道的铺设和带来的效果。新用户比例不仅是评估市场部门绩效的一个关键指标,同时也是反映网站和产品发展状况的重要指标。

  但只看新用户比例是不够的,需要结合着用户流失率一起看。我见过流失率98%的网站,也见过流失率20%左右的产品,流失率会根据产品对用户黏性的不同而显得参差不齐。用户流失率反映了网站或者产品保留用户的能力,即新用户比例反映的是用户“进来”的情况,用户流失率反映的是用户“离开”的情况,结合这两个指标会有下面3类情况,代表了3种不同的产品发展阶段:

新用户比例大于用户流失率:产品处于发展成长阶段;

新用户比例与用户流失率持平:产品处于成熟稳定阶段;

新用户比例低于用户流失率:产品处于下滑衰退阶段。

  下面附上一张反映活跃用户数、新用户比例和用户流失率的图表,你能从这张图中看出些什么,假如你是这个网站的CEO,你接下来需要从哪个角度重点着手来改善网站的运营状况?

key-user-metrics

  这篇文章可能没有涉及任何的数据和分析,这里只想理清楚用户的细分和指标,当这套用户的细分和指标体系规范化了以后,能够让用户分析变得游刃有余。

网站的活跃用户与流失用户

wastage  网站用户管理的目标是发掘新用户,保留老用户。但仅仅吸引新用户还不错,还需要保持新用户的活跃度,使其能持久地为网站创造价值;而一旦用户的活跃度下降,很可能用户就会渐渐地远离网站,进而流失。所以基于此,我们可以对用户进行又一个细分——活跃用户和流失用户。

活跃用户与流失用户

  活跃用户,这里是相对于“流失用户”的一个概念,是指那些“存活”着的用户,用户会时不时地光顾下网站,同时为网站带来一些价值。同时,我们还需要知道到底有多少用户可能已经抛弃了我们的网站,不可能再为网站创造任何的价值,也就是所谓的流失用户。

  流失用户,是指那些曾经访问过网站或注册过的用户,但由于对网站渐渐失去兴趣后逐渐远离网站,进而彻底脱离网站的那批用户。当然,一个网站一定会存在流失用户,这是网站用户新老交替中不可避免的,但流失用户的比例和变化趋势能够说明网站保留用户的能力及发展趋势。

  举个简单的例子,我们经常可以看到某些数据分析报告中说:某某网站的注册用户数已经超过几百万,但其实这些数据并没有太大的意义,因为可能这几百万里面很多用户都已经不再登录该网站(流失用户),真正最近登录过或有过操作行为的用户(活跃用户)其实不到一万。所以对于一个网站而言,真正有意义的是活跃用户数而非总用户数,因为只有这些用户在为网站创造着价值。

  活跃用户用于衡量网站的运营现状,而流失用户则用于分析网站是否存在被淘汰的风险,以及网站是否有能力留住新用户。

活跃用户分析

  我的博客中之前的文章——用Engagement衡量用户活跃度中已经介绍了用户活跃度的衡量方法,并基于Engagement的定义计算网站的活跃访问量(Visits),同样可以用这类方法计算网站的活跃用户数(Unique Visitors)。同时可以计算不同时间区间的活跃用户数,比如每天、每周、每月……这里就不再详细介绍了,需要注意以下几个问题:

  1. 用户Engagement的定义,并以唯一用户为单位进行统计;
  2. 只要用户有任一一个Engagement的行为,就可以定义为活跃用户;
  3. 不要仅关注活跃用户数,试着分析活跃用户的变化趋势和所占比例。

流失用户分析

  流失用户的定义比较简单,就是一段时间内未访问或登录过网站的用户,一般流失用户都是对于那些需要注册、提供应用服务的网站而言的,比如微博、邮箱、电子商务类网站等。不同网站对于流失的定义可能各不相同,对于微博和邮箱这类用户几乎每天登录查看的网站而言,可能用户未登录超过1个月,我们就可以认为用户可能已经流失了;而对于电子商务而言,可能3个月未登录或者半年内没有任何购买行为的用户可以被认定是流失用户。下面的分析主要是基于网站的注册用户的,因为这类用户更容易识别,而且分析这类用户的流失情况对网站而言更有意义。

数据的获取

  流失用户是通过用户的最近一次登录距离当前的时间来鉴定的,所以要分析流失用户,需要知道每个用户的最后一次登录时间,而对于不同网站而言,这个时间间隔会各不相同,最长可能会有1年或者更久,所以在数据获取方面会有一定的难度。如果分析的是注册用户,那么一般网站都会在数据库中建相应的表来存放用户信息,所以建议在储存用户基础信息的同时记录用户的最近一次登录时间,这样就能够准确地计算用户最近一次登录距离当前的间隔时间,进而区分该用户是否流失。

流失用户变化趋势

  首先需要明确的是用户的流失可能并不是永久的,也许用户在一段时间内对网站确实没有任何需求,那么他会远离网站一段比较长的时间;或者流失用户也会因为网站的某次营销或者网站质量的改善而重新回来。网站总的流失用户数的计算比较简单,以超过1个月内登录即为流失为例,那么总流失用户数就是所有“当前时间点-用户最近一次时间点>1个月”的用户数量。但是单纯的总流失用户数量对于分析是没有意义的,因为大部分情况下这个数值是一直递增的,我们需要计算总流失用户数占总用户数的比例及新增流失用户数,观察它们的变化趋势,如下表:

日期 总用户数 流失用户数 新增流失用户数 用户流失率
2010年8月1日 325694 228451   70.14%
2010年8月2日 326127 228925 474 70.20%
2010年8月3日 326789 229507 582 70.23%
2010年8月4日 326297 230023 516 70.49%
2010年8月5日 326913 230618 595 70.54%
2010年8月6日 327514 231209 591 70.60%
2010年8月7日 328163 231672 463 70.60%
2010年8月8日 328517 232216 544 70.69%
…… …… …… …… ……

新用户流失率

  也许你的网站已经吸引了一批新的访客,并且他们成功注册成为了网站的用户,你有了一个好的开始,已经成功了一半,那么另一半呢?就是如何保留住这些新的用户,让他们持续地为网站带来价值,这就是分析新用户流失率的意义。

  我们可认为新用户注册后就完成首次登陆,那么简单地定义新用户流失,就是用户在注册后一段时间内都没有登录过网站,即

当前时间点 – 用户注册时间点 > 流失临界时间间隔

  比如我们定义用户的流失临界时间间隔为1个月,也就是在注册后的一个月内未登录的用户意味着已经流失,那么就可以计算每天的新用户流失数,即注册时间为1个月前的那一天,而从注册到当前没有登录过的用户数。这个用户数与1个月前的那一天的总注册用户数的比例就是新用户的流失率

当天的新用户流失数 / 当天的总注册用户数 = 新用户流失率

  计算出每天的新用户流失率,并观察它的变化趋势:

new-user-wastage-rate

  网站能否保留住新用户就在于是否能够不断地降低新用户的流失率。

  总结,这里主要介绍的是如何分析网站真正拥有的有价值的活跃用户的数量以及网站保留这些用户的能力,可以用流失用户的变化趋势来衡量网站用户的总体流失情况,用新用户流失率衡量网站保留住新用户的能力,而分析活跃用户数的比例和变化趋势分析能够衡量网站现有用户的质量和价值。

网站新老用户分析

New-Returning-Visitors  网站中新老用户的分析已经成为了网站分析中常见的一类用户细分的方法,也是网站分析中用户分析的一个重要组成。Google Analytics中对新老用户的命名分别为New Visitors和Returning Visitors,同时也为许多的分析指标提供了基于新老用户的细分。

  简单地说,新用户就是首次访问网站或者首次使用网站服务的用户;而老用户则是之前访问过网站或者使用过网站服务的用户。无论是新老用户都能为网站带来价值,这也是分析的意义所在。

分析新老用户的意义

  网站的老用户一般都是网站的忠诚用户,有相对较高的粘度,也是为网站带来价值的主要用户群体;而新用户则意味着网站业务的发展,是网站价值不断提升的前提。可以说,老用户是网站生存的基础,新用户是网站发展的动力,所以网站的发展战略往往是在基于保留老用户的基础上不断地提升新用户数。

  所以分析新老用户的意义就在于:通过分析老用户,来确定网站的基础是否稳固,是否存在被淘汰的危机;通过分析新用户,来衡量网站的发展是否顺利,是否有更大的扩展空间。一个着眼现在,一个放眼未来。

新老用户的辨别

  对于网站用户的识别,之前写过一篇相关的文章——网站用户的识别,里面主要是在基于点击流日志的基础上提供的4类识别用户的方法,可以作为参考。但对于新老用户的辨别可能根据网站自身的特定而有不同的定义方法。

  最常见的一种辨别新老用户的方式就是看该用户之前是否访问过网站,也就是以用户是否首次访问来区分,GA就是使用Cookie来定义新老用户的,即该Cookie之前出现过则该访客为老用户,否则为新用户。这个定义适用于所有网站,但有它不准确的地方,Cookie的删除、用户更换PC等都会造成数据上的偏差。

  另一种辨别方式相对准确,但一般只适用于注册登录型网站,即定义首次注册登录的用户为新用户,再次登录的用户为老用户,而不是使用首次访问来辨别。这种区分方式一般以用户ID或用户名来辨别,相对准确,但应用的范围有限。

新老用户分析

  网站的目标在于保持老用户,拓展新用户,那么对于网站数据分析上的表现,则是在保持老用户数量的稳定增长的前提下,提升新用户的所占比例

  对于大部分发展正常的网站而言,网站的老用户数应该是保持相对稳定的,并且会有持续的小幅上涨,可以看一下GA上我的博客每周老用户数的趋势变化:

returning-visitors-trend

  可以通过GA的Dashboard上的Advanced Segments选择Returning Visitors,并选择合适的时间区间和汇总粒度(日、周、月)显示趋势变化曲线。这条平滑的上升曲线说明网站的发展是趋于正常的。

  但并不是所有网站的老用户趋势都会如此的平滑,比如旅游网站,旅游业会明显地受到季节的影响呈现比较大的波动,所以这里要引入同比环比的概念进行分析。

同比指的是为了消除季节变动的影响,将本期的数据与去年同期的数据进行比较,比如今年2月的数据与去年2月数据的比较;

环比指的是将本期的数据与前期的数据进行比较,可以是日环比、月环比、周环比等,例如今年2月与今年1月的数据比较。

  同比和环比被大量地应用于基于时间序列的趋势分析中,对于网站而言,访问量、销售额、利润等网站关键指标同样可以引用同比和环比进行分析,对于分析这些指标的变化趋势,消除季节的影响等都是有积极的效果。下面是一张基于同比和环比的旅游类网站老用户数据模拟趋势分析图:

returning-visitors-tb-hb

  从图上可以看出由于季节的影响,老用户数的波动比较大,所以相应的环比增长的波动也很大,但同比增长的趋势却相对平滑,一直保持在10%左右的增长率上面,这就可以看出网站对保持老用户是有效的,网站的运营状况较为稳定。

  可能有人会问,为什么要用绝对数量,而不是用相对数量,比如老用户占总访问用户的比例来进行趋势分析?这里主要考虑到网站会不定期的进行主动地推广营销,或者由于某些事件或媒体传播的影响而产生的被动推广的效果,这个时候可能会吸引大量的新用户进入网站而导致老用户比例的急剧下滑,而老用户的绝对数据对于网站而言相对稳定,更具参考价值。

  新用户的绝对数量并没有老用户这么稳定,也不一定会保持增长的态势,而对于新用户的分析主要是为了衡量网站推广的效果,评估上述主动营销或被动事件带来的影响,所以不建议使用绝对数值,既然老用户相对稳定,那么就可以基于新用户比例的变化趋势来分析网站某段时间的推广效果。GA的Benchmarking中提供的也是New Visits所占比例与其他网站基准线的趋势比较:

new-visits-trend

  往往曲线中某个时间点的大幅上升或下降都意味着某个营销事件的影响,而当曲线持续下降时就意味着网站推广效果的不利,需要增大推广的力度。

  如果你有关于网站新老用户分析更好的见解,欢迎评论。

网站用户的生命周期价值

customer-LTV  Avinash Kaushik的博客中最近更新的一篇文章——Calculate Customer Lifetime Value,里面非常详细地论述了什么是网站用户的生命周期价值(Lifetime Value,简称LTV),及为什么要使用LTV这个指标。其中主要阐述的是在SEM及网站推广的过程中不要仅关注于一次访问(Visit)中的转化率(Conversion Rates)和CPA(Cost Per Acquisition)这些指标,计算用户在网站的整个周期中创造的总价值将更具意义,用户生命周期价值对于衡量网站的推广策略非常具有参考价值。

什么是用户的生命周期价值

  生命周期是指一个主体从开始到结束的发展过程,所以网站用户的生命周期可以解释为用户从与网站建立关系开始到与网站彻底脱离关系的整个发展过程,而用户的生命周期价值就是在这个过程中用户为网站所带来的价值总和。

  用户的生命周期可以分为4各阶段,如下图:

customer-LTV-curve

  从用户的生命周期曲线可以看出用户在于网站建立关系期间一般会经历4个阶段,每个阶段都为网站带来不同的价值:

  考察期:用户会试探性的偶尔来访问下网站,这个时候用户创造的价值比较低;

  形成期:用户可能已经有点喜欢上你的网站了,他们会不定期的进入网站,并开始尝试做些交互,同时用户创造的价值飞速提升;

  稳定期:用户成为了网站的忠实Fans,他们经常会光顾网站,不仅自己使用网站提供的服务,同时可能还会帮助宣传网站,这个用户创造的价值到达最高峰并保持相对稳定;

  退化期:用户由于某些因素而开始与网站的关系产生裂痕,进而迅速破裂直到彻底离开,这个时期用户创造的价值迅速递减。

  需要注意的是,用户不一定在到达稳定期后与网站的关系才会衰退,在任何时期,只要有某些因素影响了用户的满意度,用户的生命周期就可能进入退化期,进而彻底脱离该网站。

如何测量用户的生命周期价值

  Avinash Kaushik在他的博客中例举的一些例子比较多的是从电子商务网站的角度,因为电子商务网站用户的生命周期价值更易于被衡量,可以直接计算用户从使用该网站开始在网站中的总消费金额、净利润等,基于这些指标通过细分用户的不同来源,可以计算不同推广策略的投资回报率(ROI),进而区分优劣。

  这种基于用户生命周期价值的网站来源评价同样也可以用于一般的网站,但是普通网站一般没有交易和销售数据,也可能不是以网站的收益作为网站的目标,那么就不能用用户的交易金额作为评价用户价值的指标。如何定义一般网站的用户生命周期价值可以参考之前的几篇有关用户分析的文章:我们还是可以采用网站用户忠诚度分析中取自Google Analytics中评价用户忠诚度的4个指标——用户访问频率、最近访问时间、平均停留时间、平均浏览页面数。这些指标是所有网站都可以测量得到的,同时提高用户的忠诚度是所有网站的共同目标,忠诚用户对网站的价值是不言而喻的,他们不仅可以为网站带来持续的价值,同时在网站线下的品牌和口碑推广上起着关键的作用。那么这4个指标如何汇总来计算得到用户的总价值指标呢?可以参考用户综合价值评分体系这篇文章,使用层次分析法(AHP)得到各指标的权重,并通过加权求和的方式计算得出用户的总价值,用该结果就可以作为衡量用户生命周期价值的评价指标。

基于用户生命周期价值的分析

  基于网站用户生命周期价值的计算结果,我们可以通过以下几个方面来对用户进行细分:

  用户的访问来源:可以对通过计算搜索引擎、外部链接、社会化网络、直接登录等方式首次访问你的网站的用户的平均生命周期价值来比较哪些来源为网站带来了最多的有价值用户:

LTV-source-analysis

  上图中柱状图表示从各来源进入我的博客的新用户数,折线图表示从各来源进来的用户的生命周期价值的平均(该来源带来的所有用户的生命周期价值总和/该来源带来的用户数,10分制)。从上图可以看出对于我的博客来说,搜索引擎带来了最多的用户(可能大部分网站都是类似的情况),而从带来的用户的生命周期价值平均值来看,外部链接是最有价值的,直接进入次之(可以用于评价网站线下推广所带来用户的价值),社会化网络再次之。所以我一般会把我看到的一些介绍网站数据分析相关的博客添加到我的外部链接表中,如果你也有网站分析相关的博客,或者认为我的博客还不错,也希望能把我的博客添加到你的外部链接表中。

  用户首次访问中浏览的内容:基于内容的细分,比如以我的博客的文章分类进行细分。可以选取用户的生命周期价值排在前100的访问用户首次访问我的博客中访问了哪些分类目录下的文章:

LTV-content-analysis

  上图柱状图表示首次访问我的博客浏览各分类文章的用户数,折线图表示生命周期价值排名前100的用户首次访问我的博客时浏览的各文章分类。这个结果就很明显了,“网站定量分析”这个内容分类为我带来了最多的新用户,同时也为我带来了最多的有价值用户,也是有价值用户转化率最高的分类目录,“个人观点分享”次之。

用户生命周期价值分析中需要注意的问题

  最后不得不说的就是这个分析中存在的一大技术难点——如何定义一个用户的首次访问。

  首先就是如何识别用户是首次访问,也就是该访问用户是新用户(New Visitor),大家估计已经注意到了在Google Analytics工具中的Visitors模块中有一项是根据New和Returning对用户进行细分,Google Analytics可以根据是否存在Cookie来进行细分,用户识别还有很多其他方法,可以参考我之前的文章——网站用户的识别,但不得不说无论何种方法对新用户的识别都存在一定的不准确性。

  另外就是如何获取用户首次访问的数据的问题。一般网站保存的统计数据有一定的期限,或者网站的数据统计起步较晚,未能统计到网站的历史数据,尤其对于已经发展了一定时间的网站或者数据量比较大的网站来说,这类统计就更显困难重重,也许这个时候网站的数据仓库就可以发挥它的价值了,数据仓库的数据集成性和保留历史数据并且不易变更的特性让其有能力可以完成诸如此类的复杂数据获取。

  今天是全国哀悼日,让我们为所有在地震中逝去的生命默哀,同时希望生还者能够尽快从伤痛中走出来,并坚强地活下去!green-ribbon

用户综合价值评分体系

user-value-scoring  前面的两篇文章介绍了基于点击流数据的适合所有网站的用户忠诚度分析及应用于电子商务网站的用户分析,并且通过雷达图可以直观的展示用户在各指标上的表现情况,我们可以通过雷达图上图形围成的面积来简单评价一个用户的综合价值。可能大家都有这样的疑问,当各指标的影响权重不同时(比如电子商务网站可能会更看重用户完成的订单数或者在一段时间内的交易额),在这种情况下我们该如何来评价用户的综合价值?如果你看过我的上一篇文章——层次分析法(AHP),相信你已经找到了满意的答案,是的,层次分析法可以很好地解决这个问题。下面就用层次分析法分别介绍一下用户忠诚度评价及电子商务网站用户的综合价值评分:

评价用户忠诚度

  用户忠诚度由4个指标——用户访问频率、最近访问时间、平均停留时间和平均浏览页面数决定,这4个指标没有明显的类别划分,并且可以认为是在同一层次上的相互独立的指标,所以只需要构建2层的模型:

AHP-model-for-user-loyalty

  我们需要计算底层每个指标对用户忠诚度的影响权重,只需要知道底层各指标间的相对比重,这个主要通过专家组或者问卷调研的方法获得数据,这里假设4个指标间两两比较的比重如下表(使用9标度):

  用户访问频率 最近访问时间 平均停留时间 平均浏览页面数
用户访问频率 1 7 3 3
最近访问时间 1/7 1 1/3 1/5
平均停留时间 1/3 3 1 1/3
平均浏览页面数 1/3 5 3 1

——表格中的数据是一个正互反矩阵,即如果“用户访问频率”与“最近访问时间”的比重为7(1-9标度的定义参见层次分析法那篇文章),则对应的表格(第2行第3列)的数值为7,矩阵对角线对称的表格(第3行第2列)的值为1/7。所以两两比较只需要完成对角线一侧的数据,另一侧取对应数值的倒数就可以了。

  因为指标间进行的是两两比较,所以整个矩阵的数据会存在不一致性,比如上表中的数据“用户访问频率”和“平均停留时间”、“平均浏览页面数”的比重都是3,那么一次应该推断“平均停留时间”和“平均浏览页面数”的比重应该是1,也就是同等重要,但是下面该比重的实际数据是1/3。所以可以看到两两比较的过程只在乎两个指标的关系,不存在推导关系,这样就会导致整个矩阵存在不一致性,在计算权重前需要验证矩阵的不一致性系数,只有小于0.1时,该矩阵的数据才能被采纳。

  根据表中两两比较的结果可以通过层次分析法的矩阵运算计算各指标的权重,如果你对excel足够熟悉的话在excel里面也可以实现,这里推荐使用AHP的分析工具——Expert Choice,在这个工具里面只要构建类似上面的树状模型,然后将上表的指标两两比较的结果输入进去,软件就会自动计算出各指标相对于目标的权重及整个模型的CR(一致性概率)。导入上面的模型,输入表格中指标两两比较数据,通过软件计算得出的CR=0.05<0.1,所以数据通过检验,可以进一步获取各指标的权重,得到以下的加权加权计算公式:

  用户忠诚度=用户访问频率*0.525+最近访问时间*0.056+平均停留时间*0.139+平均浏览页面数*0.279

  基于该结果,我们可以将标准化后的用户每个指标的评分数据进行加权求和,还是以网站用户忠诚度分析一文中的两个用户为例,采用的是10分值的评分体系,则计算用户的忠诚度如下:

评分 用户访问频率 最近访问时间 平均停留时间 平均浏览页面数 用户忠诚度
用户1 1.0 5.0 3.0 3.8 2.28
用户2 4.0 9.3 2.4 6.3 4.71
用户n …… …… …… …… ……

  通过上述的层次分析法,将多个评价指标的评分结果加权汇总到一个目标指标,有利于更直接地评价用户,通过上述结果可以算出每个网站用户的忠诚度评分,可以直接排序选择忠诚度排名靠前的用户展开定向营销。

评价电子商务网站用户的综合价值 

  通过上面的分析实例,大家对层次分析的应用应该有了一定的熟悉,那么对于更加复杂的多层次分析模型,层次分析法又是如何实现的呢?下面就以电子商务网站用户分析这篇文章中的指标体系为例来简要介绍下。首先也是构建评价指标体系模型,从电子商务的交易数据中获取的指标更为丰富,我们根据文中对指标的阐述,将指标进一步分层,可以建立起3层结构的模型,如下图:

AHP-model-for-E-commerce-user

  基于这个模型,需要使用3次AHP来计算:

  1. 忠诚度和消费能力对用户价值的影响权重;
  2. 最近购买时间、购买频率和购买产品种类对忠诚度的影响权重;
  3. 平均每次消费额和单次最高消费额对消费能力的影响权重。

  分别在每一步中获取指标两两比较的权重,计算矩阵的一致性概率CR,若通过则计算获得每个指标对上层相应指标的影响权重系数,最终我们可以得到类似如下的结果:

  用户价值=忠诚度*0.67+消费能力*0.33

  忠诚度=最近购买时间*0.12+购买频率*0.64+购买产品种类*0.24

  消费能力=平均每次消费额*0.67+单词最高消费额*0.33

则可以推导的出用户价值的直接计算公式:

  用户价值=(最近购买时间*0.12+购买频率*0.64+购买产品种类*0.24)*0.67+(平均每次消费额*0.67+单词最高消费额*0.33)*0.33  →

  用户价值=最近购买时间*0.08+购买频率*0.43+购买产品种类*0.16+平均每次消费额*0.22+单词最高消费额*0.11

  还是用文中例举的两个用户为例来计算他们的综合价值评分,如下表:

评分 最近购买时间 购买频率 购买产品种类 平均每次消费额 单词最高消费额 忠诚度 消费能力 用户价值
用户1 2 3 3 8 9 2.88 8.33 4.68
用户2 7 7 8 6 5 7.24 5.67 6.72
用户n …… …… …… …… …… …… …… ……

  从上表可以看出,在运用层次分析法获得的分析结果中,不仅能够计算出最终的目标指标(用户价值)的评分,同时也能够计算得到模型的中间层指标(忠诚度和消费能力)的评分,这样我们不仅能够通过直接比较用户的综合价值评分获取网站的重要用户,同时忠诚度和消费能力的评分也为针对用户的细分提供了一个有力的量化数值参考依据,如下图:

E-commerce-user-value-plot

——100个随机样本数据的散点分布,图中的数据仅供参考,不代表任何网站的实际情况

  上面的散点图是对用户忠诚度和消费能力的一个简单展示,从图中点的聚集情况(或者点分布的密集度)可以将图简单分成4块,满足各分块内部的各点间距离最短(最密集)及各分块间的点分布距离最长(最离散),其实可以看做是一个最简单的聚类,从中可以看出电子商务网站用户特征的分布情况:

  • 从C区域可以看出用户较多地分布在忠诚度和消费能力评分为3附近的区域,也是网站最普遍的客户群;
  • B区域的用户是网站的最有价值客户(VIP),但是数量相当稀少,可能不到10%;
  • 在A区域有一个点密集区间(忠诚度1-2、消费能力8-9),可以认为是网站的高级消费用户群,他们消费不多,但消费额很高,如果你的网站提供高级消费品、批发、团购等服务的话,那么他们就可能是那方面的客户群;
  • D区域的用户虽然消费能力也不强,但他们是你的网站的忠实Fans,不要忽视这些用户,他们往往是网站线下营销和品牌口碑传播的有利拥护者。

  通过类似上面的分析过程,我们可以发现电子商务网站用户的某些特征,为网站的运营方向和营销策略提供一定的决策支持。

  这篇文章里面主要讨论的是运用层次分析法对网站用户的一个评价应用案例,其实层次分析法不仅适用于网站用户的评价,同样适用于网站页面、产品、来源、关键词及其它任何牵涉多指标可分层的评价,关键在于如何建立起一套系统的有效的指标评价体系。如果你有更好的扩展思路,欢迎与我评论交流。

电子商务网站用户分析

user-importance  前一篇文章主要是基于点击流数据的用户分析,适合所有网站,而对于一些特殊的网站,可以根据自身所能获取的数据将分析的指标进行扩展或根据自身的特征定制合适的指标,这里主要介绍的是适合一般的电子商务网站的用户分析方法。

  当用户在电子商务网站上有了购买行为之后,就从潜在客户变成了网站的价值客户。电子商务网站一般都会将用户的交易信息,包括购买时间、购买商品、购买数量、支付金额等信息保存在自己的数据库里面,所以对于这些用户,我们可以基于网站的运营数据对他们的交易行为进行分析,以估计每位用户的价值,及针对每位用户的扩展营销(Lead Generation)的可能性。

评价用户价值的指标

  对于评价指标的选择这里遵循3个原则:

  • 指标可量化:没办法,要做定量分析,这个是最基本的前提;
  • 尽可能全面:根据底层数据选择尽可能多的可以获取的指标,这样能够从多角度进行分析和评价;
  • 线性独立:即指标间尽量保持不相关。比如如果选择用户的购买次数和总消费额,那么一定是购买次数越多的用户总消费额越高,也就是导致了评价维度上的重合,而选择购买次数和平均每次交易额可以避免这种相关性产生的弊端。

  根据以上几个原则选取了以下几个指标(同样根据网站的特征选取合适的统计时间段):

  1. 最近购买时间:用户最近一次购买距当前的天数;
  2. 购买频率:用户在这段时间内购买的次数;
  3. 平均每次交易额:用户在这段时间内的消费总额/购买的次数;
  4. 单次最高交易额:用户在这段时间内购买的单词最高支付金额;
  5. 购买商品种类:用户在这段时间内购买的商品种类或商品大类。

用户评价模型的展示

  一样的,也可以用雷达图进行展示,同样也使用离差标准化的方法对每个指标进行消除度量单位的10分制评分。这里具体的方法就不再重复介绍了,请参照——网站用户忠诚度分析这篇文章。下面是一个雷达图的示例:

E-Commerce-user-RadarChart

  通过这个雷达图,我们可以读到比用户忠诚度更多的信息。图中的上面3个指标——最近购买时间、购买频率和购买商品种类可以用来评价用户的忠诚度,而下面的2个指标——平均每次交易额和单词最高交易额可以用来衡量用户的消费能力。如上图,用户1虽然购买频率和购买的广度不高,但其消费的能力较强,而用户2是频繁购买用户,对网站有一定的忠诚度,但其消费能力一般。所以图形的上半部分面积较大的用户拥有较高的忠诚度,而下半部分面积较大的用户具有更高的消费能力。这两类用户都是网站的有价值客户,但由于其类型的不同,在营销策略上可以分开对待。

用户交易行为分析的意义

  • 发现网站的高价值客户(VIP),为客户关系管理(CRM)及保持有价值客户提供支持;
  • 发掘网站的可发展用户,对于一些新客户或潜力客户进行针对性营销;
  • 及时发现可能流失的客户,及时采取有效措施;
  • 根据用户交易行为细分客户群,实施有针对性的营销策略。

网站用户忠诚度分析

user-loyalty-analysis  忠诚用户不仅能为网站创造持续的价值,同时也是网站品牌口碑推广的重要渠道,所以目前网站对忠诚用户愈加重视。可能很多网站或者网站分析工具对用户做了“新用户”和“回访用户”的划分,但是单单区分新老用户是不够了,我们需要更加完善的指标来衡量网站用户的忠诚度。

  用户忠诚度(Loyalty),指的是用户出于对企业或品牌的偏好而经常性重复购买的程度。对于网站来说,用户忠诚度则是用户出于对网站的功能或偏好而经常访问该网站的行为。根据客户忠诚理论,忠诚度可以由以下4个指标来度量:

  • 重复购买意向(Repurchase Intention:购买以前购买过的类型产品的意愿;
  • 交叉购买意向(Cross-buying Intention:购买以前为购买的产品类型或扩展服务的意愿;
  • 客户推荐意向(Customer Reference Intention:向其他潜在客户推荐,传递品牌口碑的意愿;
  • 价格忍耐力(Price Tolerance:客户愿意支付的最高价格。

量化网站的用户忠诚度

  以上的4个指标对于电子商务网站而言,可能还有适用性,但对于大多数网站是不合适的,所以为了让分析具有普遍的适用性,同时为了满足所有的指标都可以量化(上面的客户推荐意向比较难以量化),以便进行定量分析的要求,这里可以选取Google Analytics中对用户忠诚度的4个度量指标:Repeated Times、Recency、Length of Visit、Depth of Visit,即用户访问频率、最近访问时间、平均停留时间、平均访问页面数,这些指标可以直接从网站的点击流数据中计算得到,对所有的网站都适用,下面看一下这些指标的定义及如何计算得到(一些网站度量的相关定义请参考——网站分析的基本度量):

  • 访问频率:用户在一段时间内访问网站的次数,即每个用户Visits的个数;
  • 最近访问时间:用户最近访问网站的时间,因为这个指标是个时间点的概念,所以为了便于度量,一般取用户最近访问时间距当前的天数。
  • 平均停留时间:用户一段时间内每次访问的平均停留时间,即每个用户Time on Site的和/Visits的个数;
  • 平均访问页面数:用户一段时间内每次访问的平均浏览页面数,即每个用户Page Views的和/ Visits的个数。

  统计数据的时间区间也是根据网站的特征来定的,如果网站的信息更新较快,用户访问较为频繁,那么可以适当选取较短的时间段,这样数据变化上的灵敏度会高些;反之,则选择稍长的时间段,这样用户的数据更为丰富,指标的分析结果也会更加准确有效。

用户忠诚度的展示和比较

  上面的4个指标均可以被量化统计得到,单一的指标也是没有意义的,我们需要通过比较来找出哪些是忠诚用户,哪些是流失用户,可以先对指标进行一些处理,以便使它们之间更具可比性,可以参考之前的文章——数据的标准化),这里我采用的是min-max标准化的方法,首先将所有指标的数值全部转换到[0,1]区间,再进行倍数放大,比如使用10分制进行评分,则可以乘10,数据就全部分布在[0,10]区间内了,如下图:

    访问频率 最近访问时间 平均停留时间 平均访问页面
用户1 数据 2次 15天前 150秒 3页
标准化 0.10 0.50 0.30 0.38
评分 1 5 3 3.8
用户2 数据 8次 2天前 120秒 5页
标准化 0.40 0.93 0.24 0.63
评分 4 9.3 2.4 6.3

——表中的数据只是简单的举例,实际情况需要根据每个指标的最大最小值进行计算

  根据上表的数据,我们已经将所有指标统一到了同一个评分区间,那么就可以使用雷达图对用户的忠诚度进行展示。用雷达图展示有以下几个优点:

  • 可以完整地显示所有评价指标;
  • 显示用户在各指标评分中的偏向性;
  • 可以简单分析用户忠诚度的综合评分,即图形围成的面积(假设四个指标的权重相等,若重要程度存在明显差异,则不能用的面积来衡量);
  • 可以用于用户间忠诚度的比较。

  下面是根据上表绘制的雷达图示例:

user-loyalty-RadarChart

用户忠诚度分析的意义

  那么基于这个展示的结果我们能做些什么呢?其实对于任何网站而言,有两个方向是一致的:保留忠诚用户减少流失用户。基于上面的用户忠诚度评价体系扩展开来就是:

  1. 分析忠诚用户的行为特征,努力满足他们的需求,提高他们的满意度;
  2. 从最近访问时间的指标数据机用户忠诚度变化趋势中发现一些可能正在流失的用户,分析他们流失的可能原因,并试图挽留流失用户;
  3. 比较忠诚用户和流失用户在指标数值上的差异,寻找哪些指标的差距导致了用户忠诚度的降低,优化网站在这些方面的表现。

  所以,我这里使用的是基于用户访问频率、最近访问时间、平均停留时间、平均访问页面数这4个指标来评价网站用户的忠诚度,并用雷达图进行展示和比较,也许你可以根据自己网站的特征找到更加适合的指标和展示方式,而最终需要做的是能够更加精确地找到网站的忠实用户,并努力留住他们。