分类目录归档:个人观点分享

一些个人的观点和想法

优化网站导航设计

——让用户更容易地找到需要的信息3

optimize-navigation  之前已经介绍过为了让用户更容易地找到需要的信息,可以对网站的信息架构和站内搜索进行分析和优化,而另一个能对用户起到很好引导作用的就是网站的导航功能,所以这篇文章主要分析用户对网站导航功能的使用情况,并在此基础上合理地优化网站的导航设计。

网站导航的作用

  网站导航的最终目的就是帮助用户找到他们需要的信息,如果说得详细点,那么可以概括为下面3个用处:

  1. 引导用户完成网站各内容页面间的跳转。这个是最常见的,全局导航、局部导航和辅助导航等都是为了引导用户浏览相关的页面;

  2. 理清网站各内容与链接间的联系。即对网站整理内容的一个索引和理解,这个最常见的应用就是网站地图和内容索引表,展现了整个网站的目录信息,帮助用户快速找到相应的内容;

  3. 定位用户在网站中所处的位置。这个在面包屑导航中得到了充分的体现,它帮助用户识别当前浏览的页面与网站整体内容间关系,及其与网站中其它内容的联系和区分。

网站导航的分析

  通过分析用户使用网站导航功能的情况,可以来评估网站各导航功能设计上的优劣,这里主要从导航的利用率实现度有效性符合度4个方面进行分析:

利用率

  网站导航的利用率,即用户使用各类导航功能的情况。最直观的分析方法就是使用点击热图,具体可以参考我之前的文章——网站点击热图,也可以使用页面覆盖图(Overlay),Google Analytics上面默认提供了网站首页的Overlay:

homepage-overlay

  从图中可以区分网站首页各区域导航功能的使用情况,包括顶部导航,侧边栏的各导航模块等。如果是独立的导航索引页面,我们可以查看这些页面的浏览次数(Pageviews)访问量(Visits)等指标来分析它们被使用的情况。比如你通过点击我的博客顶部导航中的“网站地图”进入了分类导航索引页面,会看到该页面的URL地址为http://webdataanalysis.net/site-map/,我们可以在Google Analytics上面通过filter来查看该页面的访问情况:

sitemap-pageview

  通过比较各导航页面的这些指标我们可以分析得到用户对导航功能的整体使用情况以及各导航的使用比例或使用偏好。

实现度

  我们需要知道当用户试图使用导航功能时,有多少用户真正点击导航中的链接或者有多少用户进行了下一步操作。所以这里可以分析各导航页面的点击转化率(CTR),即用户在导航页中的点击次数/导航页面被浏览的次数,其实上面页面覆盖图指直接给出了页面中每个可点击对象的点击转化率,你可以将它们汇总就是整个页面的点击转化率,也可以查看导航页面各链接的点击转化率。但Google Analytics上面无法提供一些子页面的覆盖图,只能选择其它的工具或者试图监控导航页面所有的点击事件。

  另外一种分析导航功能实现度的方法就是通过离开率(Exit Rate)这个指标,如果一个用户进入了导航页面后直接离开了网站,那么导航的功能就没有实现(当然如果用户返回了上层页面或者回到首页,导航功能同样也没有实现,这些操作无法体现在Exit Rate)。比如我的博客的分类目录导航页面,该类页面的URL地址都会包含“/category/”,所以也可以在GA上面直接filter出来所有这类地址,我们看看这些页面的Exit Rate情况,如下图:

category-statistics

  这里因为缺少导航页面Exit Rate的评判基准,所以我无法判断我的导航页面效果到底如何,有兴趣的朋友可以在下面的评论把你们的网站或博客导航页面的Exit Rate贴上来看看,大家交流比较下。

有效性

  与网站的内容页面不同,导航页面的目标是让用户更快地找到想要的信息,我们不需要用户过久地停留在导航页,正如Google的口号:We may be the only people in the world who can say our goal is to have people leave our homepage as quickly as possible(让用户尽快离开自己的网站)。

  所以对于导航页面而言,页面平均停留时间(Avg. Time on Page)越短,则该导航页的质量就越高(当然用户要有点击才行)。页面平均停留时间也是GA中分析页面的基本度量,上图也有显示。

符合度

  或者称为导航的效果,用户在使用导航功能找到相应的页面后,是否对该页面提供的信息感兴趣,或者说这些是不是他们想找的信息。

  假设用户在使用导航功能后找到了需要的信息或者完成了预期的任务,那么在行为可能表现为在使用导航后继续在网站停留了一段时间,或者用户最终到达了任务的成功页面或网站的目标页面(如用户完成注册、电子商务网站下单或购物成功等)。所以我们可以使用导航的后续停留时间任务完成度目标转化率这些分析度量来衡量导航的实现效果到底如何。

  总结一下:

  1. 用点击热图、Pageviews和Visits来衡量各导航的使用情况,点击或浏览越多,说明该导航的利用率就越高;
  2. 用点击转化率(CTR)和离开率(Exit Rate)来衡量导航的实现度,CTR越高、Exit Rate越小,说明导航的实现度越好;
  3. 用页面平均停留时间(Avg. Time on Page)来衡量导航的有效性,用户在页面的停留时间越短,说明导航的功能越有效(基于导航已经拥有较好的实现度);
  4. 用户在使用导航后的停留时间及任务完成度、目标转化率可以衡量导航的符合度,用户的任务完成度或目标转化率越高,则导航的符合度越高。

导航设计的优化

  基于对以上4个方面的分析,我们可以对网站进行针对性的优化。

a) 提高有效导航的利用率,将用户最常用或效果最佳的导航放在最醒目的位置;

  结合上面的分析,将那些利用率高,效果好的导航功能放到醒目的位置,让用户更方便地使用这些功能。

b) 去除无效导航或者无人使用的导航,精简网站设计;

  导航功能并不是越多越好,只要提供够用、有效的导航就行,结合上面的利用率和实现度,将那些没人使用或点击转化较差的导航功能进行精简。

c) 提高导航描述与对应内容的关联度,不要误导用户,赢得用户的信任并保持用户对网站的兴趣;

  不要试图去做标题党,如果一个导航页面拥有了较好的利用率和实现度,那么千万不要辜负用户的期望,为他们提供相符的高质量的内容,这样才能真正地留住用户。

d) 优化导航页面内容的组织和展示。

  如果有效性不高,用户经常需要在导航页中逗留一段时间才能找到自己想要去的地方,那么也许导航页就失去了其最根本的价值。如何更好地展示导航的内容可能是一个复杂的问题,涉及信息设计、分类、排序等多方面,或者有些网站设计师能想出一些别出心裁的展示方式来吸引用户的眼球,这里直接上张图吧:

search-cube

  好了,我对网站导航的分析优化说完了,你是否还有更多高见,欢迎在下面评论分享。

网站分析的应用和价值

Web-Analytics  前几天突然想到,如果有人问:“网站分析主要是干什么的?投入成本来进行数据收集和数据分析又有何意义?”也许我第一反应的回答是:“网站分析能帮你更好地优化网站和推广网站。”但仔细想想,这些问题确实没有深入地思考过,也许我们日常中更多去探究网站分析的方法和实现,而对于网站分析的根本意义却没有真正地去想过。所以,这里整理了一下个人看到的目前网站分析的一些应用及体现出来的价值,算是对上面问题的一个简单回答。

监控网站的运营状态

  网站分析最基本的应用就是监控网站的运营状态。收集网站日常产生的各类数据——点击流数据、运营数据、用户数据等,并通过统计这些数据生成各类网站分析的报表,对网站的运营状态进行系统地展现。从点击次数、浏览次数、用户数的变化趋势,到比较新老用户比率、页面流失率和目标的实现率,数据帮助运营者从多角度观察网站的状况是否良好。

  如果没有网站分析的日常报表数据,无疑会让网站运营者感到恐慌,因为他们失去了对网站现状的感知,也许网站一天会有几千几万的访问量,也有可能只有个位数的用户访问了网站,这样网站的运营就像是闭门造车,没有了目标和方向。

  当然,有些网站的数据不仅能监控自身网站的运营状况,而且互联网或某些领域的发展状态提供参考依据,Google的搜索趋势、百度的搜索风云榜是网络热点的风向标,当然我们现在可能会更多地去关注微博上的实时热点信息;淘宝的数据中心为电子商务的交易趋向提供依据。

提升网站的推广效果

Website-promotion  说到网站推广,也许最先想到的就是SEOSEM,但网站分析不仅能够提升网站在SEO和SEM上的表现,同时其对网站的精准营销也能起到有力的支持。

SEO和SEM

  SEO和SEM是网站分析中很重要的一块,因为它们是网站获取流量的重要途径,而流量又是网站的基础,所以我们必须清楚的把握网站在SEO和SEM方面的表现。

  分析SEO主要是分析网站在各搜索引擎的相关关键词排名、搜索词的点击转化率(CTR)及网站在搜索引擎的收录情况、外链数据、错误页面等,关于SEO网上的介绍很多,最关键的还是网站自身的内容质量及在SEO上面的优化。

  SEM的效果很多是通过计算各关键词或者推广来源的投资收益(ROI)来衡量的,一般投入成本比较容易衡量,而产出收益的衡量就会相对困难,需要细分各来源和关键词,电子商务还有直接的利润可以衡量,如果只是信息发布引导线下交易那么分析会困难得多,网上也有很多这方面的文章可以参考。

精准营销

  SEO和SEM提高了网站的曝光率,让用户能够更容易地找到我们的网站,但有时我们也需要将我们的网站定向地推给某些用户,也就是网站推广中最常见的线上推广。

  这里主要包括用户细分、来源细分和目标市场的细分,通过用户行为分析进行的用户细分让我们能够了解网站主要吸引的是哪类用户,基于来源的搜索关键词和来源网站可以了解用户主要关心网站的哪些信息以及他们会通过哪些相关的途径找到我们,这为我们的线上推广指明了方向。如果网站要发布一个产品或者做一个活动,也许这时候你就清楚的知道需要给那些用户发直邮,在哪些网站上投放广告,推广的内容应该如何组织能够吸引到更多的用户……

  我之前的很多关于用户分析的文章介绍了如何更好地去发现网站的忠诚客户、有价值客户,以及用定量的方法去评价网站的用户,其实这些也为网站的精准营销提供了很好的参考依据。

线下推广效果

  除了线上推广外,很多网站也会定期进行线下的推广。线下的活动和推广往往会直接展示网站的URL地址,在数据的表现上以直达流量为主,所以评估线下推广效果的关键在于区分哪些流量来源于线下推广?其实网站分析的数据获取途径十分广泛,我们可以通过一些特殊的手段来做到这一点。

  比如你会发现Avinash Kaushik的书里面引用的很多网址是类似短网址(Short Url)的形式,通过跳转转到相应的页面,线下推广也可以借用这种方式,在线下公布一个特殊的专用于某次推广的网址(如http://webdataanalysis.net/offline)重定向到目标页面(如http://webdataanalysis.net/),这样在网站分析中只要选取那些来源是公布出去的特殊的URL(如http://webdataanalysis.net/offline)的浏览就可以统计线下推广的效果了,当然也可以使用URL参数的方式在目标URL后面加上类似?from=offline&campaign=……的参数,通过统计这些参数页面被浏览的次数并细分各线下推广途径的效果。  但这里有个问题就是,网址往往是网站品牌的一大要素,尤其是那些直观易记的网址,所以线下推广偏向于使用原始的网站地址,以便于有更好的辨识度,让用户记住这个网站,这就给网站分析的流量区分带来了一定的难度,也许只有通过访问流量的趋势分析来衡量线下推广的效果了。

优化网站的用户体验

User-Experience  通过对外推广,也许已经有很多用户开始进入并访问你的网站了,但用户是否会对你的网站感兴趣,或者是否能够持续访问变成网站的忠实用户,这些就取决于你的网站是否有留住用户的能力了,也就是你的网站是否具有足够好的用户体验,来实现用户的期望和满意度

简单有效的交互流程

  无疑,那些简单易用的交互流程能够帮助用户更好地实现他们的操作和目标,而用户也会更喜欢使用那些设计得更加人性化的网站,能让他们随心所欲的穿梭其间。

  我们通常会用转化率(Conversion Rate)任务完成率(Task Completion Rate)来衡量网站交互的效果,而对于某些基于任务或者应用导向的网站,这方面的分析尤其重要。通过分析找出一些交互中的不足和遗漏环节或者化繁为简,能够有效提高转化率及用户完成任务的几率,从而有效提高网站的收益。

帮助用户找到感兴趣的内容

  我的博客中近期的几篇文章都介绍了如何让用户更好地找到需要的信息,其中包括优化信息架构、优化站内搜索等,这些无疑都能更好地留住用户,让他们继续浏览网站的内容或者继续使用网站的提供的服务。

  与其被动地让用户自己去寻找感兴趣的内容,不如主动地将一些用户可能感兴趣的内容推荐给用户,也就是现在很多网站都在做的基于用户行为分析的关联推荐功能,我之前的文章也介绍过网站数据分析在这方面的应用。

倾听用户的心声

  也许很多人对网站分析的概念还停留在网站的日常数据报表上,其实网站分析的范围远不止这些,用户问卷调研(Survey)可用性测试(Lab usability testing)、以及我之前介绍过的实景调研(Site visits)都属于网站分析的范畴,Avinash Kaushik把它们归为网站分析中的定性分析(Qualitative Analysis)。也许你会说这些不是UED或者UCD们的工作吗?是的,这些分析的目的都是为了提升用户体验,UED们是用户体验方面的专家,而网站分析师在数据的获取和分析方面更加专业,所以为什么不合作呢?网站分析师提供分析的方案和结果,再由用户体验小组完成优化方案的设计并实施,不要纠结于网站分析工作一定由哪个部门或团队来做,所有的工作都是为了提供更好的用户体验。

  正是这些定性分析的方法能够让我们近距离的聆听用户的声音,对满足用户需求,更好地进行网站的内容设计、功能设计,甚至交互导航设计都能起到关键作用。

  最后做下简单的总结,如果网站就是为了流量而活的话,那么我们可以将上面网站分析的应用和意义归纳为:监控流量吸引流量保留流量,流量意味着用户,用户意味着网站的生命。

  但也许现在我们该考虑下社会化媒体的影响了,不仅仅是SEO和SEM。Twitter的关键词广告平台、移动设备——手机、ipad的应用普及,今后的网站分析可以做得更多,对网站产生的价值也会越来越大。也许上面我提到的只是网站分析的冰山一角,现在有越来越多的人开始从事网站分析并喜欢上了这一职业,网站分析的发展日新月异,一定会有更多的新的应用,让我们拭目以待。

优化网站内部搜索

——让用户更容易地找到需要的信息2

optimize-site-search  关于如何让用户更容易地找到需要的信息,上一篇文章中介绍了使用优化网站信息架构的方式,这篇文章主要介绍的是通过优化站内搜索的方式来帮助用户找到需要的信息。

  站内搜索已经成为目前几乎所有网站必不可少的一块功能,尤其在内容丰富的网站中,当用户有目的地寻找目标内容但又无法直接从首页或导航页中直接找到时,这时用户就会求助于站内搜索。

分析站内搜索的意义

  分析站内搜索最常见的就是分析用户的搜索短语或者关键词,通过关键词了解用户的需求,但是某些基于搜索后的用户操作和行为分析分析往往更有价值;站内搜索的意义主要包括以下几点:

细化用户需求

  用户在站内搜索的关键词往往与站外搜索有较大区别,比如用户可能会通过Google搜索“ThinkPad笔记本”,但当用户进入某个销售笔记本电脑的电子商务网站时,他们通过站内搜索的往往就是诸如“ThinkPad X200”,所以从站内搜索分析得到的关键词往往更能体现用户更细节层面的需求。

发现用户最关注的内容

  这是一种最直观的分析结果意义的体现,即通过查看站内搜索关键词的排名或者热门程度来了解用户在你的网站上最关注于哪些信息,往往这些排名靠前的关键词所涉及的内容就是网站的核心价值,因为用户期望看到更多的关于这些方面的内容。

寻找用户的潜在需求

  很明显,站内搜索并非每次都会有结果,用户的需求是多样的,而网站的内容是有限的。如果用户通过站内搜索未找到结果或者没有后续操作,或者一直翻页直到离开,那么就说明用户没有找到他们需要的信息。而这些没有结果或没有操作的关键词就变成了用户可能的潜在需求,也许你该考虑下是不是该提供一些相关的内容来充实你的网站。

站内搜索的分析度量

  那么为了体现以上的几个意义,应该如何分析站内搜索?也许站内搜索不仅是搜索短语或者关键词的排名,我们应该同时关注用户搜索行为的后续操作,也就是用户是不是真正通过站内搜索找到了他们需要的信息,所以在分析站内搜索的时候我们需要关注一些相关的度量。先看看Google Analytics上站内搜索的分析度量:

GA-Site-Search-Metrics

搜索访问次数(Visits with Search)

  这个很好理解,就是使用了站内搜索的访问数(Visits)。

唯一搜索总次数(Total Unique Searches)

  这个应该理解为每个Session搜索唯一关键词的总次数之和,同一个session中多次搜索同一个搜索关键词只会被记为一次,可以被用于根据搜索短语的细分度量。

结果页面浏览数/搜索次数(Results Pageviews/Search)

  也就是平均每次搜索后浏览搜索结果列表页面数。

搜索退出率(Search Exits)

  搜索退出,即搜索后立即退出了网站,搜索操作是用户该次浏览的最后一个操作;那么搜索退出率就是搜索退出访问数/总搜索访问数。

搜索改进率(Search Refinements)

  当用户完成一次搜索后又进行了另一次的搜索,我们就可以定义后一步搜索是改进搜索;那么搜索改进率就是改进搜索的次数/总的搜索次数。

搜索后平均停留时间(Time after Search)

  每次搜索后用户在网站的停留时间(如果一个访问有多次搜索,则前几次搜索都是每相邻两次搜索的间隔时间,最后一次搜索是从搜索到用户离开网站的时间)的总和/搜索访问数。

搜索后平均浏览页面数(Search Depth)

  每次搜索后用户浏览的页面数(如果一个访问有多次搜索,则前几次搜索都是每相邻两次搜索间浏览的页面数,最后一次搜索是从搜索到用户离开网站前浏览的页面数)的总和/搜索访问数。

  站内搜索的分析度量可能还有很多,还需要关注搜索关键短语的排名情况(Top Key Phrases),或者搜索结果列表的页面覆盖图(search results page overlay),这个可以更好地帮你了解搜索关键词在结果页面的曝光和点击情况。

评估站内搜索的效率

  有了上述的度量,我们就可以分析和评价站内搜索的效率。

站内搜索利用率

  这个比较容易评价,只要将用到搜索的访问数/网站的总访问数,就是站内搜索的利用率。

站内搜索的有效性

  这是对站内搜索来说比较重要的一个分析,即站内搜索到底有没有很好地实现它的功能。主要通过搜索退出率、搜索改进率和平均浏览搜索结果页面数这3个度量来评价,退出率和改进率越低,同时平均浏览搜索结果页面数越少,那么说明站内搜索越有效,效率越高。

站内搜索的效果

  主要通过搜索后平均停留时间和平均浏览页面数来评价站内搜索的效果,但这些因素往往不是站内搜索功能呢个本身所能控制的,站内搜索只是帮助用户更好地匹配搜索关键词跟网站内容的关系,帮助用户找到相关的内容,至于之后用户对内容的兴趣如何还得看网站本身的内容质量。

站内搜索的价值

  当评估价值时,不得不提到的几个网站分析度量:转化率(Conversion Rate), 任务完成度(Task Completion), 目标达到率(Reach Object)。

  对于电子商务网站而言,这个评价较为简单,因为电子商务网站的目标比较单一——利润,所以只要分析用户每次搜索的订单转化率、交易完成率,及每次搜索所能获取的收益等就可以用于评估内部搜索对于网站的价值,当然你还能根据搜索的关键词进行细分,看看哪些关键词为你带来的最大的收益。

  如果网站没有明确而单一的目标,那么评价内部搜索的价值就会有些困难,但是如果你在Google Analytics上设置的网站目标,那么问题就会简单得多,Google Analytics会根据你设置的目标帮你计算出每次搜索到达目标的次数,目标的转化率及平均每次搜索的目标价值(如果你为每个目标设置了价值指数的话)。

GA-Site-Search-Goal

优化站内搜索

  通过分析站内搜索,我们可以根据以上各度量的结果对网站的搜索功能进行针对性的优化。

优化结果排序

  当网站的平均浏览搜索结果页面数偏高时,我们需要关注下是不是站内搜索的结果排序存在问题。我们可以看到很多网站的搜索结果提供了排序选择功能,这里看一下Wordpress网站的插件搜索页面:

Wordpress-plugins-search

  这里提供了5中搜索结果排序方式可供选择:相关性、最高评分、最新发布、最近更新和最热门插件,但发现即使提供了这么多种排序方式,我有时还是搜索不到自己想要的插件,也许我会想要对结果进行相关性和最高评分的组合排序。

  但优化结果排序最关键的还是对默认排序的优化,用户在点击搜索按钮之后都会愿意看到结果列表中显示的是最符合搜索预期的内容,也就是他最感兴趣的内容,那么对于他找到自己想要的信息当然是最有力的。所以,尽量减少用户的多余操作(自己选择合适的排序方式),一开始就帮用户做到最好。

优化信息设计

  信息设计是指对信息的分类、整理和罗列的过程,对于一个内容丰富、分类繁多的网站而言,提供系统清晰的信息设计,可以让信息的检索事半功倍。

  我们分析搜索改进度量的时候,如果发现用户的搜索改进一般都是在区分信息的分类或者改进关键词的细节表述,那么这时候可以考虑为用户提供搜索结果筛选的功能,如太平洋上面提供了极为丰富的信息筛选功能:

pconline-search

同义词与结果推荐

  用户在输入搜索关键词的时候有时会拼写错误,或者用户可能输入的是模糊定义的短语,这些可以直接分析站内搜索关键词搜索改进等来确认你的网站用户是不是普遍存在这类行为,所以我们需要为用户提供一些关键词的改进建议及结果的推荐,下面是我在淘宝中输入“诺记亚”进行搜索时它为我提供的搜索建议:

taobao-nokia-search

  所以,站内搜索可以说是一个比较复杂的功能,尤其是想把它优化的更好的时候,所以很多大的公司有专门的团队来研究和改进站内搜索功能。建议在优化站内搜索的时候考虑使用网站分析的方法让优化的工作具有更加明确的目标和方面,同时通过比较优化前后网站分析中相应的度量,可以为优化的效果提供有力的量化参考指标。

网站页面度量与细分

page-metrics-and-segment 我们在使用一些网站分析工具的时候会发现一般报表会被分成三大模块:用户访问内容浏览流量来源。每个分类都由各种分析度量组成了各类的展示报表,这里先介绍一下内容浏览模块(主要指的是网站的页面浏览)下的各种度量,以及基于这些度量我们可以实现哪些细分。

页面的基本度量

关于一些常见的网站分析度量的定义可以参考我之前的文章——网站分析的基本度量,下面罗列的是一些页面的度量:

页面浏览次数(Pageviews)

页面被打开或请求的次数。

唯一页面浏览次数(Unique Pageviews)

这个是Google Analytics上面使用的一个度量,主要是避免页面的重复加载和刷新导致Pageviews虚高的情况,所以在同一个Visit当中重复打开同一个页面,该页面的Unique Pageviews始终只被记为1次。

访问次数(Visits)

页面的被访问次数,如果按照独立页面来计算每个页面的Visits,其实结果与上面的Unique Pageviews是一致的,所以很多网站能分析工具里面没有Unique Pageviews,而直接用Visits来衡量页面的唯一浏览量。但需要注意的是Visits也常被用作整个网站或者某些内容分类汇总的度量,在这种情况下,网站的总Visits和总Unique Pageviews是不一致的,比如Visit A访问了a-b-a-c4个页面,而Visit B只访问了a-b,那么对于a页面而言,Pageviews是3,Unique Pageviews是2,Visits也是2,但对于这个网站而言,Unique Pageviews是5,而Visits只有2个。

唯一访问用户数(Unique Visitors)

这个应该容易理解,就是进入这个页面的不同IP或者Cookie的个数。

页面停留时间(Time on Page)

用户浏览一个页面时在该页面逗留的时间,在度量页面时,更多的是根据用户取平均值,即页面平均停留时间(Avg. Time on Page)=该页面被浏览的停留时间总和/该页面被浏览次数(GA里面排除了从该页面离开的Pageviews,即Exits)。

直接跳出访问数(Bounces)

也许你可以看到过很多关于这个定义的解释了,一般的网站分析工具,都会将从该页面进入网站并直接离开的访问称为Bounce。而这个度量更多的是以Bounce Rate的形式出现,即从该页面直接跳出的访问数/从该页面进入的访问数。

进入和离开次数(Entrances and Exits)

这个就顾名思义了,从该页面进入、离开的访问数,而一般会以Enter Rate和Exit Rate的形式出现,从该页面进入、离开的访问数/该页面的总访问数。

page-metrics

还有一些其它的页面度量,如新访问用户(New Visits)目标价值(Goal Value)等。

需要关注的页面度量

我们会注意到一般的网站分析工具的结果展现会有许多不同的报表,并且各类报表中又会有重复或不重复的各类度量,当然每张报表可能都会有其不同的展示角度并提供不同的数据分析的用途。但也许我们日常无法全面地关注所有度量,一般都会根据网站的特点着重的关注某些跟网站运营状态息息相关的度量。Google Analytics内容模块的几张报表上一般会展现:

Pageviews、Unique Pageviews、Avg. Time on Page、Bounce Rate、%Exit(离开百分比)及$Index(目标价值指数)

下面列出的是我个人认为对于评价网站页面比较重要的几个度量,或者说是个人比较喜欢和关注的几个度量:

1. 访问量(Visits)或者唯一页面浏览次数(Unique Pageviews)

上面已经对这两个度量进行了介绍,它们对于单个页面而言计算得到的数值是一样的,只会在计算汇总的时候存在差异。那么为什么选择访问量,而不是页面浏览数或者唯一用户数呢?我的理解是在同一个Visit中,如果用户多次浏览同一页面,那么很有可能使用户喜欢刷新或重载页面,或者用户习惯于倒退操作而重复穿梭于你的网站,所以这些重复浏览对于评价页面的优劣比较没有意义;而如果是不同的Visit,即使是同一用户浏览了同一页面,那么我们更多地可以理解为用户对于上次看到的内容意犹未尽,想再仔细研究个究竟,这种页面浏览对于评价一个页面是有效的,所以我更偏向于选择页面的访问量Visits。

2. 崩失率(Bounce Rate)

好吧,无论你怎么称呼它,都不得不承认它的魅力十足,网站有很多相关的文章,在我的博客之前也写过一篇——关于Bounce Rate定义的疑问

对于它的价值我是这样理解的,用户会直接跳出,无非3种情况:1.误闯;2.内容过于乏味;3.进入的页面也是网站的出口。所以在关注Bounce Rate的时候有必要进行特殊情况特殊分析,比如网站首页的Bounce相对比较高是可以理解的,因为作为网站最前端的大门,可能会有相当一部分用户误闯了进来;而网站的底层内容细节页面的Bounce Rate比较高有可能用户直接进入该页面,找到了需要的信息并离开了,也就是上面所说的第3种情况。而排除这两种特殊的访问,如果其他页面的Bounce Rate偏高,那么说明该页面有问题了。

3. 页面平均停留时间(Avg. Time on Page)

这个应该比较容易理解,用户需要获取你页面中的某些信息就会需要一定的浏览时间,当然根据页面提供的内容的长短和复杂度,平均停留时间也会存在一定的差异,但我们不需要关注这类情况,我们只需要揪出那些平均停留时间短到用户几乎无法对页面内容作出有效反应就已经离开了的那些页面,毫无疑问这些页面是有问题的。

页面细分

基于上面介绍的这些度量,我们可以选择任何的单个或者多个来对页面进行细分,我想到的有以下结果细分的方法:

基于Pageviews、Unique Pageviews、UniqueVisitors区分热门页面和冷门页面;

基于Avg. Time on Page区分有趣的内容和乏味的内容;

基于Bounce Rate及下一浏览页面的多样性来区分病态页面和枢纽页面;

基于Enter Rate和Exit Rate来识别网站的入口和出口页面;

……

当然,你还可以想到很多种其他细分的方法,只要细分的结果对你的网站而言是有价值的。这里举个简单的用多个度量组合进行细分的例子,选取的度量就是上面3个我认为值得关注的页面度量。既然涉及3个度量,大部分的平面坐标系的图表无法很好的展示,也许你也跟我一样想到了一类图表——气泡图,下面是一个简单展示:

page-segment-xlbubble

横坐标标识访问量,纵坐标标识Bounce Rate,气泡的半径r标识页面平均停留时间,我们可以将页面细分成4类,分别对应4个象限,其中:

第一象限:较高的访问量和Bounce Rate,所以页面比较热门但并不能吸引所有进入的用户,也许你的网站的首页或者Landing Page正是处于这一象限,你可能需要优化下SEO的关键词或者购买相关性更高的广告或者关键词,也可以优化下你的首页和Landing Page,让它们更具吸引力以留住用户;

第二象限:如果你的网站有很多页面处于这个象限,那么你的网站正处在一个糟糕的状况下,而往往这一象限内的气泡也会比较小;

第三象限:其实在这一象限的某些页面是可以通过提升曝光率来提升它们的访问量,因为从Bounce Rate来看它们并不缺少吸引力;当然,如果某些内容只针对特定人群,而其他人群对它们的兴趣不高,那么处于第三象限也是一个正常的状况;

第四象限:这些页面集中了你的网站的一些黄金内容,看看它们到底在哪些方面吸引了这么多的用户,让其他页面也学习一下它们。

也许你还能想到其它更加有趣的页面细分方法,欢迎与我分享交流。

网站用户的生命周期价值

customer-LTV  Avinash Kaushik的博客中最近更新的一篇文章——Calculate Customer Lifetime Value,里面非常详细地论述了什么是网站用户的生命周期价值(Lifetime Value,简称LTV),及为什么要使用LTV这个指标。其中主要阐述的是在SEM及网站推广的过程中不要仅关注于一次访问(Visit)中的转化率(Conversion Rates)和CPA(Cost Per Acquisition)这些指标,计算用户在网站的整个周期中创造的总价值将更具意义,用户生命周期价值对于衡量网站的推广策略非常具有参考价值。

什么是用户的生命周期价值

  生命周期是指一个主体从开始到结束的发展过程,所以网站用户的生命周期可以解释为用户从与网站建立关系开始到与网站彻底脱离关系的整个发展过程,而用户的生命周期价值就是在这个过程中用户为网站所带来的价值总和。

  用户的生命周期可以分为4各阶段,如下图:

customer-LTV-curve

  从用户的生命周期曲线可以看出用户在于网站建立关系期间一般会经历4个阶段,每个阶段都为网站带来不同的价值:

  考察期:用户会试探性的偶尔来访问下网站,这个时候用户创造的价值比较低;

  形成期:用户可能已经有点喜欢上你的网站了,他们会不定期的进入网站,并开始尝试做些交互,同时用户创造的价值飞速提升;

  稳定期:用户成为了网站的忠实Fans,他们经常会光顾网站,不仅自己使用网站提供的服务,同时可能还会帮助宣传网站,这个用户创造的价值到达最高峰并保持相对稳定;

  退化期:用户由于某些因素而开始与网站的关系产生裂痕,进而迅速破裂直到彻底离开,这个时期用户创造的价值迅速递减。

  需要注意的是,用户不一定在到达稳定期后与网站的关系才会衰退,在任何时期,只要有某些因素影响了用户的满意度,用户的生命周期就可能进入退化期,进而彻底脱离该网站。

如何测量用户的生命周期价值

  Avinash Kaushik在他的博客中例举的一些例子比较多的是从电子商务网站的角度,因为电子商务网站用户的生命周期价值更易于被衡量,可以直接计算用户从使用该网站开始在网站中的总消费金额、净利润等,基于这些指标通过细分用户的不同来源,可以计算不同推广策略的投资回报率(ROI),进而区分优劣。

  这种基于用户生命周期价值的网站来源评价同样也可以用于一般的网站,但是普通网站一般没有交易和销售数据,也可能不是以网站的收益作为网站的目标,那么就不能用用户的交易金额作为评价用户价值的指标。如何定义一般网站的用户生命周期价值可以参考之前的几篇有关用户分析的文章:我们还是可以采用网站用户忠诚度分析中取自Google Analytics中评价用户忠诚度的4个指标——用户访问频率、最近访问时间、平均停留时间、平均浏览页面数。这些指标是所有网站都可以测量得到的,同时提高用户的忠诚度是所有网站的共同目标,忠诚用户对网站的价值是不言而喻的,他们不仅可以为网站带来持续的价值,同时在网站线下的品牌和口碑推广上起着关键的作用。那么这4个指标如何汇总来计算得到用户的总价值指标呢?可以参考用户综合价值评分体系这篇文章,使用层次分析法(AHP)得到各指标的权重,并通过加权求和的方式计算得出用户的总价值,用该结果就可以作为衡量用户生命周期价值的评价指标。

基于用户生命周期价值的分析

  基于网站用户生命周期价值的计算结果,我们可以通过以下几个方面来对用户进行细分:

  用户的访问来源:可以对通过计算搜索引擎、外部链接、社会化网络、直接登录等方式首次访问你的网站的用户的平均生命周期价值来比较哪些来源为网站带来了最多的有价值用户:

LTV-source-analysis

  上图中柱状图表示从各来源进入我的博客的新用户数,折线图表示从各来源进来的用户的生命周期价值的平均(该来源带来的所有用户的生命周期价值总和/该来源带来的用户数,10分制)。从上图可以看出对于我的博客来说,搜索引擎带来了最多的用户(可能大部分网站都是类似的情况),而从带来的用户的生命周期价值平均值来看,外部链接是最有价值的,直接进入次之(可以用于评价网站线下推广所带来用户的价值),社会化网络再次之。所以我一般会把我看到的一些介绍网站数据分析相关的博客添加到我的外部链接表中,如果你也有网站分析相关的博客,或者认为我的博客还不错,也希望能把我的博客添加到你的外部链接表中。

  用户首次访问中浏览的内容:基于内容的细分,比如以我的博客的文章分类进行细分。可以选取用户的生命周期价值排在前100的访问用户首次访问我的博客中访问了哪些分类目录下的文章:

LTV-content-analysis

  上图柱状图表示首次访问我的博客浏览各分类文章的用户数,折线图表示生命周期价值排名前100的用户首次访问我的博客时浏览的各文章分类。这个结果就很明显了,“网站定量分析”这个内容分类为我带来了最多的新用户,同时也为我带来了最多的有价值用户,也是有价值用户转化率最高的分类目录,“个人观点分享”次之。

用户生命周期价值分析中需要注意的问题

  最后不得不说的就是这个分析中存在的一大技术难点——如何定义一个用户的首次访问。

  首先就是如何识别用户是首次访问,也就是该访问用户是新用户(New Visitor),大家估计已经注意到了在Google Analytics工具中的Visitors模块中有一项是根据New和Returning对用户进行细分,Google Analytics可以根据是否存在Cookie来进行细分,用户识别还有很多其他方法,可以参考我之前的文章——网站用户的识别,但不得不说无论何种方法对新用户的识别都存在一定的不准确性。

  另外就是如何获取用户首次访问的数据的问题。一般网站保存的统计数据有一定的期限,或者网站的数据统计起步较晚,未能统计到网站的历史数据,尤其对于已经发展了一定时间的网站或者数据量比较大的网站来说,这类统计就更显困难重重,也许这个时候网站的数据仓库就可以发挥它的价值了,数据仓库的数据集成性和保留历史数据并且不易变更的特性让其有能力可以完成诸如此类的复杂数据获取。

  今天是全国哀悼日,让我们为所有在地震中逝去的生命默哀,同时希望生还者能够尽快从伤痛中走出来,并坚强地活下去!green-ribbon

关于Bounce Rate定义的疑问

bounce  Bounce Rate是网站分析中一个比较有意思的度量,也是Avinash Kaushik个人比较喜欢的一个度量,目前网上对它的讨论也比较多。目前用的比较多的是“跳出率”这个翻译,个人比较喜欢Sidney的翻译——崩失率,音译和意译兼备。原本一直以为Bounce Rate的定义就是只浏览了单个页面的访问量占总访问量比率,无论是Google Analytics的“Single PV Visits/Total Visits”还是Omniture的“Single Page Visits/Total Visits”,计算的方法都较为类似。但最近在翻Avinash Kaushik的《Web Analytics》时,发现Avinash Kaushik对Bounce Rate的定义推荐使用Time on Site,即访问的停留时间小于10秒或5秒的访问量所占的比例,不知道是不是因为这本书出版已经有点时间了的关系,不知道《Web Analytics 2.0》中对Bounce Rate的定义是怎么样的。

  但是无论用Visits的页面数还是Time on site来定义Bounce Rate,其实都存在陷阱,都会引起Bounce Rate过高。

Bounce Rate中的陷阱

  先来说说为什么Avinash Kaushik推荐使用Time on Site,据《Web Analytics》中Bounce Rate相关内容章节中的介绍,Avinash Kaushik是根据实践的经验得出用户在网站的停留时间小于10秒时,一般无法完成一次有效的交互(Engagement)。当然根据网站类型的不同,Bounce的Time on Site的可以在5-10秒这个区间里面选择一个合适的值。

  之所以使用停留时间,而不用浏览的页面数,是因为用单页面的访问来定义Bounce是不准确的。就像基于Wordpress的博客,可能很多用户只需要访问首页就可以浏览最新发布的文章,也就是说虽然只访问了一个页面但达到了期望的目的——浏览该博客最近发布的文章,基于RSS的订阅也是这种情况,那么我们就不能认为这类访问是Bounce的。再举个更直观的例子,Twitter上包括查看最近tweets或发布tweet,其实都是在同一URL——twitter.com下完成的,如果单纯使用单页面访问来定义Bounce Rate,估计Twitter.com的Bounce Rate会达到98%以上,这样就无法真正体现Bounce Rate指标的意义了。

  既然用Page或PV=1来衡量Bounce存在以上的弊端,那么为什么这么多的网站分析工具还是使用这一标准呢?首先我们必须清楚Avinash Kaushik推荐使用Time on Site是基于一定的前提的,即网站的停留时间可以进行准确的测量,而现在停留时间的普遍计算方法是存在缺陷的,可以参考我之前的文章——WEB日志的作用和缺陷中对停留时间缺陷的说明。当然也有一些特殊的方法是可以获得用户离开网站的时间点的,如用户点击链接时的页面重定向,关闭浏览器时弹出隐藏窗口等,这些技术因为其实现方式在某些程度上会影响用户的使用,或让用户感觉不适,被认为是不雅的手段,所以一般不建议使用。

pitfall

  所以一般我们是很难得到用户真正离开网站的时间点的,当前一些流行的分析工具也是如此,这就会导致Time on Site无法得到准确的测量,那结果就是所有单页面的Visits的Time on Site都是0,而那些0<Time on Site<10s的Visits其实只是那些从进入页面到离开页面停留时间小于10秒的访问,而不是真正的访问停留时间就一定小于10秒(我们无法知道他在最后一个页面的停留时间)。这种情况下的Time on Site将会把我们引入一个更深的陷阱,所以目前的大部分分析工具基于其本身获取数据的能力选择“单个页面的访问量占总访问量比率”作为Bounce Rate也是可以理解的,或者更像是一个无奈之举。

  所以,对于Bounce Rate其实可以保持谨慎的乐观,也许你的网站并没有分析数据上显示的这么糟。那么Bounce Rate这个有趣的度量有没有更加有效的定义方法呢?我目前还没有找到,欢迎大家回复讨论。

网站用户的识别

web-users  用户分析是网站分析中一个重要的组成部分,在分析用户之前我们必须首先能够识别每个用户,分辨哪些是”New Customer”,哪些是”Repeat Customer”。这样不但能够更加清晰地了解到底有多少用户访问了你的网站,分辨他们是谁(用户ID、邮箱、性别年龄等);同时也能够帮助你更好地跟踪你的用户,发现它们的行为特征、兴趣爱好及个性化的设置等,以便于更好地把握用户需求,提升用户体验。

  通常当你的网站提供了注册服务,而用户注册并登陆过你的网站,那么用户可以更容易地被识别,因为网站一般都会保存注册用户的详细信息;但是你的网站并不需要注册,而用户的行为以浏览为主,这是用户识别就会显得较为困难,下面提供了几种常用的用户识别的方法:

识别用户的几种方法

  当用户并未注册登录的情况下,识别用户的唯一途径就只剩下用户浏览行为的点击流数据,通常情况下它们会保存在WEB日志里面,关于WEB日志的详细说明可以参考我之前的文章——WEB日志格式。而WEB日志本身存在的缺陷可能导致用户识别的不准确性,关于WEB日志的缺陷可以参考之前的文章——WEB日志的作用和缺陷,所以我们在选择用户识别方法的过程中,在条件允许的情况下尽量选择更为准确的方法:

1、基于IP的用户识别

  IP地址是最容易获取的信息,任何的WEB日志中均会包含,但其局限性也较为明显:伪IP、代理、动态IP、局域网共享同一公网IP出口……这些情况都会影响基于IP来识别用户的准确性,所以IP识别用户的准确性比较低,目前一般不会直接采用IP来识别用户。

  获取难度:★

  准确度:★

2、基于IP+Agent的用户识别

  同样基于最简单形式的WEB日志,我们可以增加一项——Agent,来提高单一IP方式识别用户的准确性。Agent也是WEB日志中一般都会包含的信息,通过IP+Agent的方式可以适当提高IP代理、公用IP这类情况下用户的分辨度,同时通过Agent还可以识别网络爬虫等特殊“用户”,但同样准确度也欠高。

  获取难度:★

  准确度:★★

3、基于cookie的用户识别

  当你通过自定义Apache日志格式或者JavaScript的方法获得用户cookie的时候,其实你已经找到了一个更有效的用户识别的手段。cookie在未被清除的其前提下可以认为是跟某个访问客户端电脑绑定的(一个客户端有可能包含多个cookie),所以用cookie来标识用户其实指的是用户使用的客户端电脑,而并非用户本身。

  用cookie识别用户的方法当然也存在缺陷:最常见的就是cookie被清除而导致用户无法与原先记录实现对应;同时由于客户端电脑会被共用,或者用户会在不同的电脑上访问你的网站,这个时候cookie就无法直接对应到该用户了。

  获取难度:★☆

  准确度:★★☆

4、基于用户ID的用户识别

  基于用户ID的用户识别是最为准确,因为一般情况下用户不同共享他的用户ID,所以我们可以认为数据中的userid唯一地指向该用户,几乎不存在偏差。当然要使用用户ID来识别用户是需要一定的前提条件的:网站必须是提供用户注册登录服务的,并且可以通过一些手段在点击流数据中记录userid。

  获取难度:★★

  准确度:★★★

  所以对于一个需要用户ID注册登录的网站来说,用户唯一标识符的选择可以遵从以下顺序:当用户注册登录时以userid为准,当用户在未登录状态浏览时以用户的cookie为准,当用户未登录且cookie无法获取的情况下以IP+Agent为准;这样就能从最大程度上识别唯一用户。

  这里推荐一个网站日志中cookie项的自定义设置方法,以便更好地识别用户。cookie是从用户端存放的cookie文件记录中获取的,这个文件里面一般在包含一个cookieid的同时也会记下用户在该网站的userid(如果你的网站需要注册登陆并且该用户曾经登录过你的网站且cookie未被删除),所以在记录日志文件中cookie项的时候可以优先去查询cookie中是否含有用户ID类的信息,如果存在则将用户ID写到日志的cookie项,如果不存在则查找是否有cookieid,如果有则记录,没有则记为”-”,这样日志中的cookie就可以直接作为最有效的用户唯一标识符被用作统计。当然这里需要注意该方法只有网站本身才能够实现,因为用户ID作为用户隐私信息只有该网站才知道其在cookie的设置及存放位置,第三方统计工具一般很难获取。

获取用户信息的途径

  通过以上的方法实现用户身份的唯一标识后,我们可以通过一些途径来采集用户的基础信息、特征信息及行为信息,然后为每位用户建立起详细的Profile:

  1) 用户注册时填写的用户注册信息及基本资料;

  2) 从网站日志中得到的用户浏览行为数据;

  3) 从数据库中获取的用户网站业务应用数据;

  4) 基于用户历史数据的推导和预测;

  5) 通过直接联系用户或者用户调研的途径获得的用户数据;

  6) 有第三方服务机构提供的用户数据。

识别并获取用户信息的价值

  通过用户身份识别及用户基本信息的采集,我们可以通过网站分析的各种方法在网站是实现一些有价值的应用:

  • 基于用户特征信息的用户细分;
  • 基于用户的个性化页面设置;
  • 基于用户行为数据的关联推荐;
  • 基于用户兴趣的定向营销;
  • ……

网站数据分析的基本流程

  网站数据分析没有规范的分析流程容易使最后的结果逻辑混乱或者偏离原来的主题,所以一套规范的流程能够使网站分析更加清晰和有效。

  网站分析其实就是一个发现问题、分析问题的解决问题的过程。问题的发现可以来源于多方面:网站运营中遇到的问题、用户的反馈和抱怨、日常统计数据的表现异常等;分析问题的过程就是根据遇到的问题运用合理的方法对其进行解释,这也是本站重点探讨的方向;而最后的解决问题则是最为关键的一点,也是目前最被忽视的一点,目前的网站分析工作往往在找到问题后无法落实到寻求最优的解决方案并执行和解决问题这一点上,即使采取了相应的措施也无法进行持续的反馈,并从根本真正地解决问题,很多只是针对一时的举措,而解决问题的过程恰好是最能体现公司执行力的时候,如果没有最终解决问题或者实现优化,那么网站分析就没有丝毫的价值。

  随着互联网的不断发展成熟,网站的发展趋势将更加规范化、精细化,更加注重用户体验,今后的网站建设很重要的一点就是网站的质量管理,所以这里就借用质量管理里面的六西格玛中的DMAIC循环来梳理一下网站数据分析的流程,DMAIC是PDCA质量环的改进,这里将其核心设置为“用户体验”,因为不同网站会有不同的目标,而提高“用户体验”可以说是所有网站的共同目标。

DMAIC

  正如上图所示,基于DMAIC循环,网站数据分析的流程也可以用这5步来实现:

定义(Define)

  原意是识别和确定用户需求,定义任务的目标和意义。对于网站数据分析来说,可以表述为确定这次分析所针对的问题是什么,分析最终需要达到何种目的,对网站有何实际的意义,同时需要确定分析的范围,及规划本次分析工作的进度和质量控制。

测量(Measure)

  原意是收集数据,量化分析。对于网站数据分析来说,同样也是一个收集和获取数据的过程,尽量获得完整、真实、准确的数据,做好数据的预处理工作,便于分析工作的开展。

分析(Analyze)

  原意是使用数据统计和分析的方法找到问题的本质。分析不只是对数据的简单统计描述,其结果不应该是一张报表和趋势图这么简单,分析的本质应该是从表面的数据中找到问题的本质,最后需要第一步针对的问题进行归纳和总结。同时需要注意的是分析要紧跟“定义”,不能偏离问题的范围和本质。

改进(Improve)

  原意是找到最优的解决方案,是问题得到解决或者使问题的负面影响降到最低。个人认为这一步是最为关键的一步,也是目前很多网站分析工作中较为忽视的一步,很多网站分析只是呈现结果,缺少解决问题的方案,这就相当于找到了管道的漏水点却任由其漏水而不作处理,任何不付诸实践的分析结果都是废纸,毫无意义。同时这一步也是最考验网站执行力的一个步骤。

控制(Control)

  原意是监控改进的结果,使相同问题不再重现。这一步无疑是目前最被忽略的一步,很多改进方案实施之后根本不会再去关注反馈情况,而有些改进方案治标不治本,就像网站的访问量无法通过一两次的推广活动通过本质上的提升,关键还在于网站本身的质量,推广活动可能让数据在短期内获得提升,但想要保持长期地增长还是需要不断地优化和改进。所以“控制”要的是持续的反馈和监控,并不断寻找能从最根本上解决问题的最优方案。

  所以,网站建设是一个循序渐进的过程,很多网站数据分析也是长期的,不断监视、跟踪并改进,而DMAIC循环也正体现了这个概念,通过不断地网站分析来提高网站质量,提高用户体验。