月度归档:2010 年四月

网站点击热图(Heat Map)

  网站分析通过统计点击流数据及网站产生的其他各类数据,提供各种数据报表来监控网站的运营状态,为网站的优化和改进提供参考依据。但网站分析能提供的绝不仅有数据,其中点击热图(Heat Map)是对网站分析的一个很好的扩充,目前网上介绍点击热图的文章也比较多,很多网站交互设计师用点击热图来评估用户与网站之间的交互状况从而改善用户体验。这里简单介绍几个点击热图的实现工具以及用我的博客做的点击热图的实验。

几款点击热图工具

  Sidney的博客中很早以前就介绍过一款点击热图的分析工具——Crazy Egg令人惊讶的优秀网站分析工具,文章是由Tenly写的。另外网上介绍比较多的点击热图工具还有ClickTabletealeaf,这些工具都是通过JS来实现的,只要在相应的页面上嵌入JS代码,就能在这些工具的网站上查看该页面的点击效果图,实现机制跟Google Analytics较为类似。这些工具一般都需要收费,但会有1个月的免费试用期,有兴趣的可以去试试。

  另外有一款开源的工具——ClickHeat,可以下载它的源代码部署到自己的服务器上,并在网站页面中嵌入相应的JS代码来生成点击热图,然后通过调用相应的页面查看。要部署ClickHeat,服务器需要支持PHP,同时因为点击的日志和所有统计结果都保存到了部署的服务器上,所以对服务器的空间和资源占用都比较高。

点击热图应用实例

  前段时间用我的博客做了下网站点击热图的试用实验,我用的是Click Density,跟ClickTable和Crazy Egg类似,也是通过嵌入JS的方法来实现的,在结果的输出页面可以选择点击的时间段、浏览器类型等条件对结果进行筛选,下面的生成的几张点击效果图:

Heat Map

heat-map

  因为我的博客访问量不大,所以热图的分布不是很明显,但还是能看出主要的点击集中在博客最新的文章上面;另外右侧的搜索、订阅和分类目录模块也占据了一定的点击比例。一般网站的点击都会聚集在全局导航栏的下面那一块,并且呈“F”型分布,在需要下拉的页面部分点击一般就会剧减(对于需要下拉查看的内容,除非用户找到了他们需要的信息,否则一般不会过多地进行点击)。

Click Map

click-map

  这张是点击分布图,红叉代表无效的点击,绿叉代表有效点击。这个图似乎比上面单纯的显示点击分布或点击密度更有价值,因为它显示了页面的有效点击,从图上可以看出用户在浏览我的博客时除了点击文章标题和搜索框外,订阅按钮上面也分布了大量的有效点击数,这个对于博客来说至关重要,因为博客类网站的一个重要目标就是产生订阅,所以通过这个图可以查看有多少有效点击转化成了网站目标,占总的点击比例及占总的有效点击的比例。

  另外可以看到图上的某些有效点击并非一定落在可点击的对象上,正是因为博客内容更新时导致页面元素(标题位置、内容摘要行数等)的偏移,而生成的点击不会跟随页面元素移动,导致了生成图片显示上的误差。

Hover Map

hover-map

  这个图其实相当与网页覆盖图(Overlay)或点击密度图(Click density),Google Analytics上面也提供了类似的功能。网页上可点击的位置会由虚线框圈起来,鼠标放到某个框上面就会显示该模块被点击的次数及点击转化率(CTR);另外如果你为你的网站设定了目标,那么同时也会显示点击该模块的目标转化率,对于分析网站的重要页面是个不错的选择。

点击热图的价值及缺陷

点击热图的价值

  1. 通过点击热图发现用户经常点击的模块或聚焦的内容;
  2. 观察页面中的哪些模块具有较高的有效点击数,用户会尝试去点击哪些模块;
  3. 应用于A/B测试,比较不同页面的点击分布情况;
  4. 用于改进网站交互和用户体验。

点击热图的缺陷

  1. 网站点击热图虽然提供了一种很直观的网站分析途径,但其功能还需完善,因为实现机制一般都是根据页面的坐标来定位点击位置,所以不同的分辨率和网站布局方式(居中等)都会导致结果的不准确;
  2. 在使用点击热图时需要记录用户每次点击的行为,所以会对网页的性能产生影响,导致网页的加载速度变慢;
  3. 当页面各元素的位置发生大范围变动时,点击热图的结果就失效了。

  最后顺便提一下,我的博客之前的一篇文章——网站数据分析的基本流程中介绍了DMAIC模型,当时我是在查PDCA戴明环的相关资料的时候不经意间发现的,感觉很适用于网站分析的流程。前几天在翻Avinash Kaushik的《Web Analytics》,发现书中也介绍了DMAIC模型,所以感觉DMAIC确实是梳理网站分析流程的一个不错的选择。

网站用户的生命周期价值

customer-LTV  Avinash Kaushik的博客中最近更新的一篇文章——Calculate Customer Lifetime Value,里面非常详细地论述了什么是网站用户的生命周期价值(Lifetime Value,简称LTV),及为什么要使用LTV这个指标。其中主要阐述的是在SEM及网站推广的过程中不要仅关注于一次访问(Visit)中的转化率(Conversion Rates)和CPA(Cost Per Acquisition)这些指标,计算用户在网站的整个周期中创造的总价值将更具意义,用户生命周期价值对于衡量网站的推广策略非常具有参考价值。

什么是用户的生命周期价值

  生命周期是指一个主体从开始到结束的发展过程,所以网站用户的生命周期可以解释为用户从与网站建立关系开始到与网站彻底脱离关系的整个发展过程,而用户的生命周期价值就是在这个过程中用户为网站所带来的价值总和。

  用户的生命周期可以分为4各阶段,如下图:

customer-LTV-curve

  从用户的生命周期曲线可以看出用户在于网站建立关系期间一般会经历4个阶段,每个阶段都为网站带来不同的价值:

  考察期:用户会试探性的偶尔来访问下网站,这个时候用户创造的价值比较低;

  形成期:用户可能已经有点喜欢上你的网站了,他们会不定期的进入网站,并开始尝试做些交互,同时用户创造的价值飞速提升;

  稳定期:用户成为了网站的忠实Fans,他们经常会光顾网站,不仅自己使用网站提供的服务,同时可能还会帮助宣传网站,这个用户创造的价值到达最高峰并保持相对稳定;

  退化期:用户由于某些因素而开始与网站的关系产生裂痕,进而迅速破裂直到彻底离开,这个时期用户创造的价值迅速递减。

  需要注意的是,用户不一定在到达稳定期后与网站的关系才会衰退,在任何时期,只要有某些因素影响了用户的满意度,用户的生命周期就可能进入退化期,进而彻底脱离该网站。

如何测量用户的生命周期价值

  Avinash Kaushik在他的博客中例举的一些例子比较多的是从电子商务网站的角度,因为电子商务网站用户的生命周期价值更易于被衡量,可以直接计算用户从使用该网站开始在网站中的总消费金额、净利润等,基于这些指标通过细分用户的不同来源,可以计算不同推广策略的投资回报率(ROI),进而区分优劣。

  这种基于用户生命周期价值的网站来源评价同样也可以用于一般的网站,但是普通网站一般没有交易和销售数据,也可能不是以网站的收益作为网站的目标,那么就不能用用户的交易金额作为评价用户价值的指标。如何定义一般网站的用户生命周期价值可以参考之前的几篇有关用户分析的文章:我们还是可以采用网站用户忠诚度分析中取自Google Analytics中评价用户忠诚度的4个指标——用户访问频率、最近访问时间、平均停留时间、平均浏览页面数。这些指标是所有网站都可以测量得到的,同时提高用户的忠诚度是所有网站的共同目标,忠诚用户对网站的价值是不言而喻的,他们不仅可以为网站带来持续的价值,同时在网站线下的品牌和口碑推广上起着关键的作用。那么这4个指标如何汇总来计算得到用户的总价值指标呢?可以参考用户综合价值评分体系这篇文章,使用层次分析法(AHP)得到各指标的权重,并通过加权求和的方式计算得出用户的总价值,用该结果就可以作为衡量用户生命周期价值的评价指标。

基于用户生命周期价值的分析

  基于网站用户生命周期价值的计算结果,我们可以通过以下几个方面来对用户进行细分:

  用户的访问来源:可以对通过计算搜索引擎、外部链接、社会化网络、直接登录等方式首次访问你的网站的用户的平均生命周期价值来比较哪些来源为网站带来了最多的有价值用户:

LTV-source-analysis

  上图中柱状图表示从各来源进入我的博客的新用户数,折线图表示从各来源进来的用户的生命周期价值的平均(该来源带来的所有用户的生命周期价值总和/该来源带来的用户数,10分制)。从上图可以看出对于我的博客来说,搜索引擎带来了最多的用户(可能大部分网站都是类似的情况),而从带来的用户的生命周期价值平均值来看,外部链接是最有价值的,直接进入次之(可以用于评价网站线下推广所带来用户的价值),社会化网络再次之。所以我一般会把我看到的一些介绍网站数据分析相关的博客添加到我的外部链接表中,如果你也有网站分析相关的博客,或者认为我的博客还不错,也希望能把我的博客添加到你的外部链接表中。

  用户首次访问中浏览的内容:基于内容的细分,比如以我的博客的文章分类进行细分。可以选取用户的生命周期价值排在前100的访问用户首次访问我的博客中访问了哪些分类目录下的文章:

LTV-content-analysis

  上图柱状图表示首次访问我的博客浏览各分类文章的用户数,折线图表示生命周期价值排名前100的用户首次访问我的博客时浏览的各文章分类。这个结果就很明显了,“网站定量分析”这个内容分类为我带来了最多的新用户,同时也为我带来了最多的有价值用户,也是有价值用户转化率最高的分类目录,“个人观点分享”次之。

用户生命周期价值分析中需要注意的问题

  最后不得不说的就是这个分析中存在的一大技术难点——如何定义一个用户的首次访问。

  首先就是如何识别用户是首次访问,也就是该访问用户是新用户(New Visitor),大家估计已经注意到了在Google Analytics工具中的Visitors模块中有一项是根据New和Returning对用户进行细分,Google Analytics可以根据是否存在Cookie来进行细分,用户识别还有很多其他方法,可以参考我之前的文章——网站用户的识别,但不得不说无论何种方法对新用户的识别都存在一定的不准确性。

  另外就是如何获取用户首次访问的数据的问题。一般网站保存的统计数据有一定的期限,或者网站的数据统计起步较晚,未能统计到网站的历史数据,尤其对于已经发展了一定时间的网站或者数据量比较大的网站来说,这类统计就更显困难重重,也许这个时候网站的数据仓库就可以发挥它的价值了,数据仓库的数据集成性和保留历史数据并且不易变更的特性让其有能力可以完成诸如此类的复杂数据获取。

  今天是全国哀悼日,让我们为所有在地震中逝去的生命默哀,同时希望生还者能够尽快从伤痛中走出来,并坚强地活下去!green-ribbon

网站分析的数据来源

Data-Center   Avinash Kaushik在他的《Web Analytics》一书中将数据的来源分为4部分:点击流数据(Clickstream)、运营数据(Outcomes)、调研数据(Research/Qualitative)和竞争对手数据(Competitive Data)。点击流数据主要指的是用户浏览网站时产生的数据;Outcomes我更习惯叫做运营数据,主要指用户在网站中应用服务或者购买产品时记录下来的数据;调研数据主要是网站通过某些用户调研手段(线上问卷或者线下调研)获取的一些定性数据;Competitive Data直译为竞争对手数据可能不太合适,因为根据Avinash Kaushik的阐述,更像是跟网站有业务关系或竞争关系或存在某种利益影响的一切网站的可能的数据来源。

  在获取上述几类数据的同时,也许我们还可以从其他方面获取一些更为丰富的数据。下面是我对网站分析数据获取途径的整理:

网站内部数据

  网站内部数据是网站最容易获取到的数据,它们往往就存放在网站的文件系统或数据库中,也是与网站本身最为密切相关的数据,是网站分析最常见的数据来源,我们需要好好利用这部分数据。

服务器日志

  随着网站应用的不断扩张,网站日志不再局限于点击流的日志数据,如果你的网站提供上传下载、视频音乐、网页游戏等服务,那么很明显,你的网站服务器产生的绝不仅有用户浏览点击网页的日志,也不只有标准的apache日志格式日志,更多的W3C、JSON或自定义格式的输出日志也给网站分析提供了新的方向。

  网站分析不再局限于网页浏览的PV、UV,转化流失等,基于事件(Events)的分析将会越来越普遍,将会更多的关注用户在接受网站服务的整个流程的情况:上传下载是否完成,速度如何;用户是否观看的整部视频,视频的加载情况;及用户在玩网页游戏时的操作和体验分析等。Google Analytics已经支持了基于事件的分析——Event Tracking,通过JS的动作响应获取数据,但是还存在着一定的局限性。

网站分析工具

  当然,通过网站分析工具获得数据是一个最为简便快捷的方式,从原先的基于网站日志的AWStats、webalizer,到目前非常流行的基于JS Tags的Google Analytics、Omniture的SiteCatalyst,及JS和网站日志通吃的WebTrends。通过网站分析工具获得的数据一般都已经经过特殊计算,较为规范,如PV、UV、Exit Rate、Bounce Rate等,再配上一些趋势图或比例图,通过细分、排序等方法让结果更为直观。

  但通过网站分析工具得到数据也不远只这些,上面的这些数据也一样可以通过统计网站日志获得,但网站分析工具的优势在于其能通过一些嵌入页面的JS代码获得一些有趣的结果,如Google Analytics上的Overlay或者也叫Click Density——网站点击密度分布,及一些其它的网站分析工具提供的点击热图,甚至鼠标移动轨迹图。这些分析结果往往对网站优化和用户行为分析更为有效。

数据库数据

  对于一般的网站来说,存放于数据库中的数据可以大致分为3个部分:

  • 网站用户信息,一般提供注册服务的网站都会将用户的注册账号和填写的基本信息存放在数据库里面;
  • 网站应用或产品数据,就像电子商务的商品详细信息或者博客的文章信息,如商品信息会包含商品名称、库存数量、价格、特征描述等;
  • 用户在应用服务或购买产品时产生的数据,最简单的例子就是博客上用户的评论和电子商务网站的用户购买数据,购买时间、购买的用户、购买的商品、购买数量、支付的金额等。

  当然,这一部分数据的具体形式会根据网站的运营模式存在较大差异,一些业务范围很广,提供多样服务的网站其数据库中数据的组合会相当复杂。

其它

Customer-Service

  其它一切网站运营过程中产生的数据,有可能是用户创造,也有可能是网站内部创造,其中有一大部分我们可以称其为“线下数据(Offline Data)”。如用户的反馈和抱怨,可能通过网站的交流论坛,也有可能通过网站时公布的客服电话、即时通讯工具等,如果你相信“客户中心论”,那么显然对于这些数据的分析必不可少;另外一部分来源就是网站开展的线下活动,促销或推广,衡量它们开展的效果或投入产出,以便于之后更好地开展类似的线下推广。

外部数据

  网站分析除了可以从网站内部获取数据以外,通过互联网这个开放的环境,从网站外部捕获一些数据可以让分析的结果更加全面。

互联网环境数据

  即使你的网站只是一个很小的网站,但如果想让你的网站变得更好,或者不至于落后于互联网的前进脚步,那么建议你关注一下互联网的发展趋势。可以上Alexa查一下互联网中顶级网站的访问量趋势;看看comScore发布的数据或者艾瑞的数据分析报告;如果经营电子商务网站,那么刚刚上线的淘宝数据中心也许会让你感兴趣。

竞争对手数据

  时刻关注竞争对手的情况可以让你的网站不至于在竞争中落伍。除了在Alexa及一些其他的网站数据查询平台以外,直接从竞争对手网站上获取数据也是另外一条有效的途径,一般网站会出于某些原因(信息透明、数据展示等)将自己的部分统计信息展现在网站上,看看那些数据对于掌握你的竞争对手的情况是否有帮助。

合作伙伴数据

  如果你有合作的网站或者你经营的是一个电子商务网站,也许你会有相关的产品提供商、物流供应商等合作伙伴,看看他们能为你提供些什么数据。

用户数据

  尝试跟踪用户的脚步去看看他们是怎么评价你的网站的。如果你的网站已经小有名气,那么尝试在搜索引擎看看用户是怎么评价你的网站,或者通过Twitter、新浪微博等看看用户正在上面发表什么关于你的网站的言论。

  当然通过用户调研获取数据是另外一个不错的途径,通过网站上的调查问卷或者线下的用户回访,电话、IM调查,可用性实验测试等方式可以获取一些用户对网站的直观感受和真实评价,这些数据往往是十分有价值的,也是普通的网站分析工具所获取不到的。

  在分析网站的外部数据的时候,需要注意的是不要过于相信数据,外部数据相比内部数据不确定性会比较高。网站内部数据即使也不准确,但我们至少能知道数据的误差大概会有多大,是什么原因造成了数据存在误差。而外部数据一般都是有其他网站或机构公布的,每个公司,无论是数据平台、咨询公司还是合作伙伴都可能会为了某些利益而使其公布的数据更加可信或更具一定的偏向性,所以我们在分析外部数据是需要更加严格的验证和深入的分析。而对于用户调研中获取的数据,我们一般会通过统计学的方法检验数据是否可以被接受,或者是否满足一定的置信区间,这是进行数据分析前必须完成的一步。

用户综合价值评分体系

user-value-scoring  前面的两篇文章介绍了基于点击流数据的适合所有网站的用户忠诚度分析及应用于电子商务网站的用户分析,并且通过雷达图可以直观的展示用户在各指标上的表现情况,我们可以通过雷达图上图形围成的面积来简单评价一个用户的综合价值。可能大家都有这样的疑问,当各指标的影响权重不同时(比如电子商务网站可能会更看重用户完成的订单数或者在一段时间内的交易额),在这种情况下我们该如何来评价用户的综合价值?如果你看过我的上一篇文章——层次分析法(AHP),相信你已经找到了满意的答案,是的,层次分析法可以很好地解决这个问题。下面就用层次分析法分别介绍一下用户忠诚度评价及电子商务网站用户的综合价值评分:

评价用户忠诚度

  用户忠诚度由4个指标——用户访问频率、最近访问时间、平均停留时间和平均浏览页面数决定,这4个指标没有明显的类别划分,并且可以认为是在同一层次上的相互独立的指标,所以只需要构建2层的模型:

AHP-model-for-user-loyalty

  我们需要计算底层每个指标对用户忠诚度的影响权重,只需要知道底层各指标间的相对比重,这个主要通过专家组或者问卷调研的方法获得数据,这里假设4个指标间两两比较的比重如下表(使用9标度):

  用户访问频率 最近访问时间 平均停留时间 平均浏览页面数
用户访问频率 1 7 3 3
最近访问时间 1/7 1 1/3 1/5
平均停留时间 1/3 3 1 1/3
平均浏览页面数 1/3 5 3 1

——表格中的数据是一个正互反矩阵,即如果“用户访问频率”与“最近访问时间”的比重为7(1-9标度的定义参见层次分析法那篇文章),则对应的表格(第2行第3列)的数值为7,矩阵对角线对称的表格(第3行第2列)的值为1/7。所以两两比较只需要完成对角线一侧的数据,另一侧取对应数值的倒数就可以了。

  因为指标间进行的是两两比较,所以整个矩阵的数据会存在不一致性,比如上表中的数据“用户访问频率”和“平均停留时间”、“平均浏览页面数”的比重都是3,那么一次应该推断“平均停留时间”和“平均浏览页面数”的比重应该是1,也就是同等重要,但是下面该比重的实际数据是1/3。所以可以看到两两比较的过程只在乎两个指标的关系,不存在推导关系,这样就会导致整个矩阵存在不一致性,在计算权重前需要验证矩阵的不一致性系数,只有小于0.1时,该矩阵的数据才能被采纳。

  根据表中两两比较的结果可以通过层次分析法的矩阵运算计算各指标的权重,如果你对excel足够熟悉的话在excel里面也可以实现,这里推荐使用AHP的分析工具——Expert Choice,在这个工具里面只要构建类似上面的树状模型,然后将上表的指标两两比较的结果输入进去,软件就会自动计算出各指标相对于目标的权重及整个模型的CR(一致性概率)。导入上面的模型,输入表格中指标两两比较数据,通过软件计算得出的CR=0.05<0.1,所以数据通过检验,可以进一步获取各指标的权重,得到以下的加权加权计算公式:

  用户忠诚度=用户访问频率*0.525+最近访问时间*0.056+平均停留时间*0.139+平均浏览页面数*0.279

  基于该结果,我们可以将标准化后的用户每个指标的评分数据进行加权求和,还是以网站用户忠诚度分析一文中的两个用户为例,采用的是10分值的评分体系,则计算用户的忠诚度如下:

评分 用户访问频率 最近访问时间 平均停留时间 平均浏览页面数 用户忠诚度
用户1 1.0 5.0 3.0 3.8 2.28
用户2 4.0 9.3 2.4 6.3 4.71
用户n …… …… …… …… ……

  通过上述的层次分析法,将多个评价指标的评分结果加权汇总到一个目标指标,有利于更直接地评价用户,通过上述结果可以算出每个网站用户的忠诚度评分,可以直接排序选择忠诚度排名靠前的用户展开定向营销。

评价电子商务网站用户的综合价值 

  通过上面的分析实例,大家对层次分析的应用应该有了一定的熟悉,那么对于更加复杂的多层次分析模型,层次分析法又是如何实现的呢?下面就以电子商务网站用户分析这篇文章中的指标体系为例来简要介绍下。首先也是构建评价指标体系模型,从电子商务的交易数据中获取的指标更为丰富,我们根据文中对指标的阐述,将指标进一步分层,可以建立起3层结构的模型,如下图:

AHP-model-for-E-commerce-user

  基于这个模型,需要使用3次AHP来计算:

  1. 忠诚度和消费能力对用户价值的影响权重;
  2. 最近购买时间、购买频率和购买产品种类对忠诚度的影响权重;
  3. 平均每次消费额和单次最高消费额对消费能力的影响权重。

  分别在每一步中获取指标两两比较的权重,计算矩阵的一致性概率CR,若通过则计算获得每个指标对上层相应指标的影响权重系数,最终我们可以得到类似如下的结果:

  用户价值=忠诚度*0.67+消费能力*0.33

  忠诚度=最近购买时间*0.12+购买频率*0.64+购买产品种类*0.24

  消费能力=平均每次消费额*0.67+单词最高消费额*0.33

则可以推导的出用户价值的直接计算公式:

  用户价值=(最近购买时间*0.12+购买频率*0.64+购买产品种类*0.24)*0.67+(平均每次消费额*0.67+单词最高消费额*0.33)*0.33  →

  用户价值=最近购买时间*0.08+购买频率*0.43+购买产品种类*0.16+平均每次消费额*0.22+单词最高消费额*0.11

  还是用文中例举的两个用户为例来计算他们的综合价值评分,如下表:

评分 最近购买时间 购买频率 购买产品种类 平均每次消费额 单词最高消费额 忠诚度 消费能力 用户价值
用户1 2 3 3 8 9 2.88 8.33 4.68
用户2 7 7 8 6 5 7.24 5.67 6.72
用户n …… …… …… …… …… …… …… ……

  从上表可以看出,在运用层次分析法获得的分析结果中,不仅能够计算出最终的目标指标(用户价值)的评分,同时也能够计算得到模型的中间层指标(忠诚度和消费能力)的评分,这样我们不仅能够通过直接比较用户的综合价值评分获取网站的重要用户,同时忠诚度和消费能力的评分也为针对用户的细分提供了一个有力的量化数值参考依据,如下图:

E-commerce-user-value-plot

——100个随机样本数据的散点分布,图中的数据仅供参考,不代表任何网站的实际情况

  上面的散点图是对用户忠诚度和消费能力的一个简单展示,从图中点的聚集情况(或者点分布的密集度)可以将图简单分成4块,满足各分块内部的各点间距离最短(最密集)及各分块间的点分布距离最长(最离散),其实可以看做是一个最简单的聚类,从中可以看出电子商务网站用户特征的分布情况:

  • 从C区域可以看出用户较多地分布在忠诚度和消费能力评分为3附近的区域,也是网站最普遍的客户群;
  • B区域的用户是网站的最有价值客户(VIP),但是数量相当稀少,可能不到10%;
  • 在A区域有一个点密集区间(忠诚度1-2、消费能力8-9),可以认为是网站的高级消费用户群,他们消费不多,但消费额很高,如果你的网站提供高级消费品、批发、团购等服务的话,那么他们就可能是那方面的客户群;
  • D区域的用户虽然消费能力也不强,但他们是你的网站的忠实Fans,不要忽视这些用户,他们往往是网站线下营销和品牌口碑传播的有利拥护者。

  通过类似上面的分析过程,我们可以发现电子商务网站用户的某些特征,为网站的运营方向和营销策略提供一定的决策支持。

  这篇文章里面主要讨论的是运用层次分析法对网站用户的一个评价应用案例,其实层次分析法不仅适用于网站用户的评价,同样适用于网站页面、产品、来源、关键词及其它任何牵涉多指标可分层的评价,关键在于如何建立起一套系统的有效的指标评价体系。如果你有更好的扩展思路,欢迎与我评论交流。

层次分析法(AHP)

  层次分析法(Analytic Hierarchy Process)简称AHP,是美国运筹学家T. L. Saaty教授于70年代初期提出的, AHP是对定性问题进行定量分析的一种简便、灵活而又实用的多准则决策方法。它的特点是把复杂问题中的各种因素通过划分为相互联系的有序层次,使之条理化,根据对一定客观现实的主观判断结构(主要是两两比较)把专家意见和分析者的客观判断结果直接而有效地结合起来,将每个层次元素两两比较的重要性进行定量描述。而后,利用数学方法计算反映每一层次元素的相对重要性次序的权值,通过所有层次之间的总排序计算所有元素的相对权重并进行排序。

层次分析法的适用范围

  层次分析法适用于多目标决策,用于存在多个影响指标的情况下,评价各方案的优劣程度。当一个决策受到多个要素的影响,且各要素间存在层次关系,或者有明显的类别划分,同时各指标对最终评价的影响程度无法直接通过足够的数据进行量化计算的时候,就可以选择使用层次分析法。

AHP的模型结构

  首先,可以根据实际问题构建层次模型,这里以网站质量的衡量为例来简单说明下,我们可以认为网站质量主要由网站内容的质量及网站交互的友好度决定,而内容的质量又受到内容的完整性、准确性和及时性的影响;交互的友好度由交互流程的友好度及网站的整体信息架构的优良程度来决定,所以可以构建如下图的模型:

AHP-model

  为了计算各要素对上一层指标的影响权重(如内容的准确性对内容质量的影响程度有多高,需要计算出该权重,而完整性、准确性和及时性3个指标对内容质量的影响权重的和为1,其它各指标也同样满足该原则),需要构建对比矩阵,即从模型的第二层开始运用9标度对从属于上一层中每个要素的同层各要素间进行两两比较,如模型中的要素i相对于要素j对上层要素的重要程度,1表示i与j同等重要,3表示i比j略重要,5表示i比j重要,7表示i比j重要很多,9表示i比j极其重要,可以用Wi/Wj表示该重要程度,两两比较后可以得到以下矩阵:

AHP-matrix

  因为上面的矩阵是通过两两比较的结果列出来的,所有对于整个矩阵而言不一定是完全一致的,所以首先需要验证该对比矩阵的一致性。可以通过计算矩阵的最大特征值的方法来衡量矩阵的一致性,相关的指标有一致性指标CI,随机一致性指标RI,一致性比率CR=CI/RI(具体的计算方法不详细介绍了,可以参考相关资料)。一般当CR<0.1时,我们认为该对比矩阵的一致性是可以被接受的。

  如果矩阵的一致性满足要求,则可以根据矩阵的最大特征值进一步计算得到对应的特征向量,并通过对特征向量进行标准化(使特征向量中各分量的和为1)将其转化为权向量,也就是我们要求的结果,权向量中的各分量反映了各要素对其相应的上层要素的影响权重。如:

  网站质量=内容质量*0.6+交互友好*0.4

  内容质量=完整性*0.3+准确性*0.4+及时性*0.3

  交互友好=交互流程*0.7+信息架构*0.3

   在计算得到各要素相对于上层要素的权重之后,我们就可以通过加权平均的方法将最底层指标的测量结果汇总到目标指标的最总分值,用于评价各决策方案的优劣性,并选择最优方案。如:

  网站质量=(完整性*0.3+准确性*0.4+及时性*0.3)*0.6+(交互流程*0.7+信息架构*0.3)*0.4

层次分析法的应用前提

  在应用层次分析法时,必须满足以下几个前提:

  • 各层的要素必须是已知的,并且条理结构清晰,能够按层次区分排列;
  • 同一层中的各要素的关系是平等的,而各要素间相互独立,不存在显著的相关性;
  • 最底层的指标可以被量化,并能够通过一定的方法测量;
  • 需要明确各层次间要素的影响关系。