标签归档:页面分析

了解网站页面的点击情况(续)

click  前几天一个朋友让我试用了他们自己开发的记录和统计页面链接点击的工具,实现的功能类似于我上一篇文章——了解网站页面的点击情况介绍的Google Analytics上面的In-Page Analytics的功能,并且弥补了In-Page中的一些缺陷,因为这个功能无论是实现方式还是一些面向应用的设计都非常棒,所以忍不住开一个续篇来介绍一下。

  非常感谢@jasseyyang能够让我体验和试用他们自己开发的工具,跟我交流分享了工具实现过程中对一些功能的设计和考量,很多功能点都是jasseyyang根据自身应用的需要设计添加的,所以整个工具最后的实用性非常好,与他设计阶段细致的考虑是分不开的,工具的设计和实现jasseyyang已经在他的博客中进行了介绍——页面点击分析工具设计与实现

部署和使用

  首先不得不说下这个工具的部署和使用,因为很好地诠释了易用性和方便高效的数据查看体验,对于所有产品而言,易用性和使用体验都尤其重要,数据分析工具也同样如此,所以我们往往会借助图表和一些可视化方法来展现数据,但所有的数据可视化都不宜“喧宾夺主”,这里的“主”当然是数据所要表达的观点(Insight)。合理使用数据可视化可以帮助我们更高效地理解数据。

  跟很多网站分析工具一样,这个工具也使用了嵌入JS页面标记的方法,在需要监控的页面中加入一行短短的JS代码就可以,其实就是加载了一个.js文件,所有功能都包含在这个文件里面了。

  然后就是如何查看数据,只要在页面的URL后面加上#hotlink,比如我的博客首页当使用“http://webdataanalysis.net/#hotlink”时页面就会显示出各链接的点击数据,与In-Page Analytics的展现形式一样,使用了顶部的悬浮导航条和黄色小气泡,看下我的博客的截图效果:

hotlink

  悬浮导航条上面的一些选项可以对数据做一些细分和筛选,下面会介绍,页面的每个链接的旁边都会出现一个黄色小气泡显示在导航条指定条件下的点击数。当然数据的显示有权限控制,只有具有权限的用户在使用#hotlink之后才会显示数据。这个方法确实非常方便,其实很多工具都可以学习借鉴。而且点击数据的统计和显示基本都是实时的,当前产生的点击马上就会被累加显示。

数据的筛选和细分

  GA的In-Page Analytics功能没有提供直接的数据筛选和过滤功能,但我们可以通过高级群组和高级过滤器等进行数据筛选,而这个工具直接在悬浮导航栏中提供了一些基础的数据筛选和细分,包括日期和时间段、来源、新老用户:

hotlink-navigation

  如上图,导航栏最左侧直接可以选择查看今日和昨日的数据,同时也支持时间区间的选择,如这里我选择了5月18日至5月20日的所有页面点击数据。

  来源的细分也做得非常好,不但可以查看来源网站的域名(左侧的下拉框),同时支持来源网站的进一步细分,比如这里选择的是百度,因此来源被当做了搜索引擎,点击来源下拉框旁边的“来路详细”之后就会在右侧显示搜索关键词即每个搜索关键词带来的点击数;如果来源非搜索引擎,而是普通的外部链接网站,那么显示的“来路详细”就是该网站中链过来的具体页面URL,使用来源细分我们可以进一步明确各来源页面带来的点击,各搜索关键词带来的点击,及这些点击发生在页面何处,如何分布,这些在分析网站的推广效果的时候格外有用。

  最后就是位于中间的“新老访客”细分,根据jasseyyang的介绍,新老访客的识别不是根据全站的访问,而是根据每个页面的点击情况进行记录,如果用户在一个页面产生了点击,那么当用户第二天重新进入这个页面时,用户就算是该页面的老用户。这个定义考虑了具体的业务应用,因为如果用户没有访问过一个页面,即使该用户进入过你的网站,该页面对该用户而言也是陌生的,相应的产生的点击也应该是用户首次浏览该页面时感兴趣的链接。

实际的应用

hotlink-external-links  GA的In-Page Analytics功能虽然同样提供了页面的点击数据,但因为其本身统计方式上的缺陷,导致在使用中会遇到一些麻烦,造成了应用的一些局限性,而这个工具很好地解决了这些问题。

  解决的第一个问题是对外部链接的监控,如右图所示,我的博客友情推荐了另外一个朋友的一个数据监控工具,图片链接指向该工具的介绍页,像这类网站外部的链接的点击数据在GA的In-Page Analytics是不显示的,只有通过配置事件监控等方法才可以监控统计;再有就是基本每个博客中都有的友情链接表,比如我的博客会跟一些同行业朋友的博客交换链接,相互推荐,这些链接也都是站外链接;再如网站里面投放广告或者链到其他域名下的推广链接,对这些点击数的统计就可以评估广告投放的效果,其实CTR就是CPC类广告一个非常重要的考核指标。

  工具解决的另外一个问题是GA的In-Page Analytics对同一页面中相同的链接是不区分的,这样我们就无法知道点击到底来源于哪个链接,如我的博客首页展现的每一篇文章的区块其实都有3个地方可以进入该文章的详情页:

hotlink-duplicate-links

  文章的标题、文章的缩略图和阅读更多……都可以点击进入文章页面,所以我们有的时候从用户体验设计的角度会考虑内容的曝光到底是使用文字链还是使用图片抑或是文字链结合图片的效果更佳?使用这个工具就能够有效地完成这个评估。其实这个问题在之前分析手机端的应用产品时遇到过,因为手机的屏幕有限,所以每次可以曝光的内容就会受限,而我们知道尤其是首页第一屏的内容展现又尤为重要,如果我们使用图片结合简单文字说明,那么一屏可能只能曝光2-3个内容,而如果换成纯文字链接,那么可以曝光的内容可能可以增加一倍,但有时精美的图片可以有效提升用户的兴趣,进而吸引用户的点击和浏览,所以这个时候我们就需要权衡,而结合数据分析的方法可以给我们更科学和有说服力的答案。

  当然,这个工具是他们内部使用的,所以肯定还可以做很多定制性的东西,比如定制网站的目标,跟GA的In-Page Analytics一样既可以监控点击同时可以监控目标到达的情况;或者可以对某些特殊的链接做标记,以便对一些链接做特殊的细分等等。我想如果市场上有这样的工具,应该很多网站也会尝试去使用的。

了解网站页面的点击情况

  有时候我们需要了解网站页面中各链接的点击情况,尤其是网站的首页和一些中间页,这对网站的内容编排、用户体验优化都能起到很好的指导作用。Google Analytics的老版本有Site Overlay(网站覆盖图)的功能,可以查看网站首页的点击分布情况,新版本将这个功能重新命名为In-Page Analytics,可以在Content模块中查看,下面是我的博客的一张使用截图:

Google-In-Page-Analytics

  如图所示,GA的In-Page Analytics用气泡的形式显示了页面中每个可点链接的点击转化率(CTR, Click Through Rate),这里页面中各链接的点击转化率是通过页面链接的点击次数除以页面浏览次数计算得到的,用来表现用户在浏览当前页面的时候更倾向去往哪些下一页面,具体的点击次数会在鼠标移动到相应链接后显示。

  其实使用GA的In-Page Analytics不仅可以观察页面中各链接点击情况,还可以观察页面当前显示部分的点击占比,比如上图该页面显示部分的点击占比为1-41%=59%,图中最下方显示还有41%的点击是在当前显示部分的下方。这个功能其实可以告诉我们一些非常有用的信息,用户在浏览页面的时候更倾向于在哪一屏发生点击?因为目前大部分网站的页面都不会在一屏就结束,用户浏览完整的内容往往需要使用鼠标的滚轮或者进行下拉,那么大部分用户到底会关注到页面第几屏的内容,这个功能每一屏的点击占比分布可以告诉我们一些线索。

  先解释一下这里“一屏”到底是一个什么概念,这里一屏主要指用户在打开页面不进行下拉时所能显示的页面长度部分,这跟电脑的显示器和屏幕分辨率有关,比如我的博客首页在我的笔记本上打开大概显示4屏多一点,在分辨率较低的显示器下面可能需要显示的屏数就会增加,需要更多的下拉;而分辨率高的显示器一屏内能够显示的页面更长,可能就不再需要4屏。

  用户浏览页面的内容是有局限性的,并且用户对内容的兴趣和耐心也是有限的,用户往往只会重点关注一下子就映入眼帘的内容,所以页面的前面部分一定会有更多的用户关注,而随着不断下拉,后面部分的内容的关注度逐步减少,我们可以根据In-Page Analytics上面提供的数据来看看这个局部减少的过程:

page-click-distribution  根据我的博客首页的点击分布情况,超过60%的点击发生在第一屏,第二屏基本上占据了30%左右的点击,第三屏在6%-7%,下面所有剩下了几屏仅有2%-3%的页面点击占比,我们可以使用点击热图分析得到类似的页面点击分布情况。可能有人会说你的博客大部分的链接都集中在第一屏和第二屏,之后几屏的链接数量都比较少,所以点击占比前面两屏很高也是说得过去的,有一定的道理,但即使博客的第一屏和第二屏有近似密度的可点击链接,可以看到第二屏的点击量相比第一屏还是出现了大幅的衰减,另外可以通过点击热图等工具看看页面每一屏的无效点击数,基本可以看出分布的情况也大概符合上面的规律,逐屏大幅下降,在3屏之后寥寥无几。

  如果你细心关注过国内外的各个门户网站,可以看到国内外门户网站页面长度的设计存在明显的差异。可以尝试去上下Yahoo!主站、BBC、CNN等国外主流门户,基本上这些网站的首页长度设计在3-4屏;再看看国内的几个门户,网易5屏、腾讯接近6屏、新浪更是恐怖的8屏(都是基于我自己的笔记本上显示)。所以如果大部分用户浏览网站的习惯跟我的博客使用Google In-Page Analytics上面分析得出的结果相符,那么国内门户的首页后面几屏的内容基本都成为了摆设,因为100个人里面只有2-3个人会关注到这些内容。

  在之前的工作中分享“如何有效提升内容曝光点击率”也提到过类似的问题,必须格外重视首页第一屏的内容质量和呈现方式,因为这部分的内容将主导网站内容的曝光点击率。很明显,一个网站的首页浏览量大概占据了全站的20%到30%(因网站设计而异),而首页的第一屏又占据了首页60%以上的关注度,所以可以看到首页第一屏对整个网站而言是何其的重要。

categories-and-tags-click  当然,In-Page Analytics功能另外一个重要的用户就是分析各内容列表或模块的点击情况,如下图的博客侧边栏“分类目录”和“标签”两个模块的点击情况:

  如左图所示,用户显然更喜欢通过“分类目录”查看博客的内容,用户最喜欢点击哪些分类?有点出乎我的意料,“数据分析方法”和“网站分析工具”两个目录更受欢迎,想必大家都喜欢阅读和学习下工具和方法方面的内容,以后尽量多整理一些这方面的内容。 :)

  新版V5版的Google Analytics的In-Page Analytics不仅仅支持网站首页的点击情况统计,在Content模块Site Content的Pages我们可以看到上方的“Navigation Summary”标签旁边有“In-Page”标签,GA已经支持了所有页面的点击分布图,而且都是免费的,你只要在选择相应页面后点击这个“In-Page”标签就可以进行查看。

  每个页面有了点击分布情况的统计,这样对于页面各个模块或列表的效果评估就变得简单很多,正如我之前的文章——优化相关内容推荐介绍的是使用“Navigation Summary”来评估相关内容推荐模块的点击效果,这里就可以尝试使用In-Page Analytics来分析数据表现:

  右图是《T检验和卡方检验》这篇文章下方的“相关文章”推荐模块的点击情况,可以看到推荐的5篇文章都获得了不错的点击转化率,但显然排在第2位的《提升用户满意度》这篇文章的数据还不够给力,或许用户不喜欢点击这类内容看上去会比较空的标题。

related-content-click  图中有个细节不知道各位有没有注意到,“相关文章”的推荐模块只是上部分,下面还有两个链接分别指向上一篇和下一篇发布的文章,而刚好“下一篇:比较测试的设定和分析”是跟相关文章推荐模块有重复的,而这里显示的点击转化率都为5.7%,其实在In-Page Analytics这个功能里面页面中的相同链接GA是不进行分辨的,也就是GA只认URL为标识,不区分这个URL链接在页面中的位置,大概的统计逻辑应该是一个页面中链接的点击次数为referral是该页面的链接URL的浏览次数Pageviews,所以一个页面中重复链接中输出的点击率应该是根据所有相同链接点击总数计算得到了,数值是完全一致的。比如《比较测试的设定和分析》这篇文章的链接在《T检验和卡方检验》文章页面会有3个地方出现,包括图中的那两处还有右侧边栏的引导到下一篇的链接,这3处地方显示的点击转化率是这3处发生点击的总和计算得到的,数值是完全一致的。

  GA的这个处理方式给针对某个模块点击效果的评估造成了一定的困难,因为点击次数无法区分是否来源于那个模块,或者是由于其他相同链接的点击带来。当然,解决方案还是有很多,可以为模块的链接加上参数,如“相关文章”模块的链接都带上?from=related-content,也可以使用GA的事件追踪(Event Track)和虚拟页面(Virtual Page)这两种方式,具体参考用户点击与网站目标中的介绍。

  文章的内容虽然一般是在周末整理编辑的,但因为周一大家都比较忙,所以选择在周二或周三发布出来,希望大家有时间可以仔细看下。 ;)

让URL更适合分析

url-optimization   网站的存在离不开URL,URL与网站内容形影不离。URL用于唯一地标识网站的页面、内容或资源的“位置”,所以很多时候它只是被看做一种识别码,就像是商品上的条形码,对于用户来说,这些识别码是没有任何意义的,用户不需要关心它们到底代表着什么。但对于网站分析而言,URL并不只是网站内容的识别码这么简单,其实它可以在分析过程中发挥更大价值。

URL与网站内容

  URL由协议、域名、请求地址三部分组成,完整地URL唯一确定了一个请求的资源,可以是页面、内容模块、文件或多媒体资源等。对于网站而言,URL的用处是对资源的唯一定位,所以方式可以有很多,用资源的唯一描述(资源名称或简称等),资源的唯一识别码(ID、数字标记等),也可以是动态参数,这样就导致了各网站的URL会存在很大的差异。

  比如浏览网易首页=>体育频道=>意甲=>米兰新闻,它们的URL依次为 http://www.163.com/=> http://sports.163.com/=> http://sports.163.com/yj/=> http://sports.163.com/special/00051NSK/moremilan.html,其实对于用户而言对于前三个页面的URL还可以读懂,而最后一个可能就难以理解了;而在去看一下淘宝的URL,在进入首页后点击任一一个商品分类,可能展现出来的URL就已经很难读懂了。

  无论怎么样,这些URL对于网站而言都是有效的,因为它们都能做到唯一地识别网站的内容,既然如此,那么是不是URL就不再需要进行另外的整理设计了呢?还是先看看URL在网站分析中扮演着怎样的角色。

URL在网站分析中的用处

  我们知道,在网站分析中一般都是用页面的URL地址来唯一地标识一个页面(当然现在GA上也有根据页面标题显示的报表,但是网站的页面标题是可以重复的,所以无法“唯一标识”),我们根据URL地址来查看该页面的Pageviews、Unique Pageviews、Exit Rate等。但不知道大家有没有发现Google Analytics的Content模块下还有一张有趣的报表——Content Drilldown(内容下钻,关于下钻的概念可以参考文章——数据立方体与OLAP),这张报表中的Page列就像是一个树形结构可以不断地向下展开直到底层节点,其实在GA的其他报表上也有类似的下钻功能,比如Visitors—Browser Capabilities—Browsers这张报表也支持从浏览器类型到浏览器版本的下钻操作。

  也许你看了页面下钻的报表后,已经有点理解为什么URL的设计会对网站分析产生影响,下面就来看一下我的博客的实例:

  顶部导航中的“文章专题推荐”中分类罗列的一些相应的文章,并且在该页面下还根据文章分类设置了4个子页面:“电子商务分析”、“网站用户分析”、“用户体验分析”、“其他文章推荐”,URL也是按照页面的层次结构进行设计的,如下图:

GA-content-drilldown

  所以Google Analytics页面下钻的实现方式是将页面的URL根据”/”进行切分,从左向右分级存放,同时将下一层的数据向上汇总到上一层,这样报表上既可以查看每个页面的数据,也可以查看根据URL的结构向上逐层汇总的聚合数据。这对网站分析是十分有用的,因为我们同时获得了细分数据和汇总数据,从而可以从不同的数据粒度上进行分析。也许你会说不就是将同一类型的页面的数据加起来吗,在分析的时候自己加一下就行,也许上面例子中的2层并且只有4个子页面是很好处理,但如果网站页面超过3层,每层可能会有上百个子页面,那么如果没有这类下钻功能就会变得难以应付了。

  可能有的朋友会问,那有没有不通过URL来区分个页面类型和层级的?如果你是用第三方工具,就需要进行额外的设置来让网站分析工具可以识别和区分你的网站页面,比如在页面上加入Google Analytics的自定义参数(Custom Variables)区分页面类型,但是如果无法自动添加这类JS代码的话,那么对于一个页面繁多的网站这个工作量就会相当庞大。如果你用自己的分析工具或者基于网站数据仓库,也许你需要维护一张页面的维表,可以包括[页面ID,页面URL,页面描述,上级页面,页面层级]这些属性,从而建立起具有层级关系的页面结构树,当然如果你的网站时常变动,那么要维护这张维表也是一件十分头疼的事情。

  下面就以我的博客作为实例来说明下URL结构设计对于网站分析的影响是如何体现的。

我的博客的URL设计

  得益于Wordpress这个强大的开放内容管理系统,让博客的URL定制变得不再复杂。Wordpress的后台控制界面中提供了“固定链接设置”的功能,用户可以根据自己的需要设计适合自己网站的URL结构,比如我的博客的固定链接是/%category%/%postname%/,也就是/文章分类/文章名/,可以再来看一下我之前一篇文章——优化网站信息架构中的我画的Wordpress的简要信息架构图:

Wordpress-IA

  通过上图结合我的URL结构设置,可以理解为我将信息架构中的一个分支——分类目录——作为URL结构设计的主依据,这样做有什么好处?在GA的页面钻取的分析报告中我既可以查看每篇文章的数据,同时可以查看每个文章分类的汇总数据:

GA-category-drilldown

  图中左侧的数据对应我的博客侧边栏分类目录中每个分类的汇总数据,右侧的数据对应“网站定量分析(web-quantitative-analysis)”分类下面各文章的细分数据。同时,当用户使用博客侧边栏的各索引(根据分类目录、文章标签、日期归档)时,Wordpress也提供了非常友好的URL结构,比如分类目录用了/category/分类名、文章标签用了/tag/标签名、日期归档用了如/2010/09/这类年月的结构来罗列相应的文章列表,这样就可以在GA中同样可以使用跟上面一样的下钻来分析有多少用户试图使用这些功能来索引博客文章,并且查看了哪些分类、标签或者日期归档,有兴趣的朋友可以到自己的Google Analytics上面试试。

  这是我的博客的URL设计,每个网站可以根据自身的特点和需要设计适合自己的URL结构,从而有效地简化和提升网站分析中页面数据的细分和汇总。

总结

  层次清晰、结构规范的URL不但可以为网站分析节省更多的工作量,同时可以提高URL的可读性,有效地提升对搜索引擎的友好度,增加网站SEO的效果。而清晰的URL结构需要基于对网站信息架构的系统有效的梳理,一旦做好了这些,一定会让网站建设的各个方面都受益匪浅。

  需要注意的是,URL的设计和规则需要在网站开发阶段就进行明确定义,写入相关的设计规范和文档中,因为一旦网站上线后要想再对URL的结构进行调整将会是一件极度麻烦并且得不偿失的事情。

  中秋节在江南阴雨绵绵的天气中度过,接下来马上又是7天的长假,提前祝大家度过一个Happy的国庆假期!

优化相关内容推荐

——让用户更容易地找到需要的信息4

  博客之前的一篇文章——优化网站导航设计,介绍了如何评价网站导航功能及基于分析的优化。但后来才发现其中遗漏了Google Analytics上一个很实用的功能——Navigation Summary,字面上翻译是“导航概要”,但似乎用“页面上下游”(百度统计上的称呼,拿过来先借用下)分析更加贴切。它能够很好地分析网站导航的实现度(说得直观点就是导航功能上的有效点击或操作),下面就来介绍下这个功能。

更好地衡量导航实现度

  先看一下我的“文章专题推荐”这个导航索引页面的在GA的Navigation Summary报表(该功能在Content模块的Top Content标签下面):

featured-topics-navigation-summary

  从上图可以看到页面被浏览的次数(图中标注1),有多少的比例的Visits是从站外进入这个页面开始访问网站的(图中标注2),有多少的比例的Visits是从网站内部的页面跳转到这个页面的(图中标注3),有多少的比例的Visits在浏览的该页面后离开了网站(图中标注4),有多少比例的Visits从该页面进入了网站的其他页面(图中标注5,4和5部分现在貌似数据有点问题);同时列出了网站内部前10名的上游页面(浏览该页面之前用户所在的那个页面,图中标注6)和下游页面(浏览该页面后紧接着浏览的下一个页面,图中标注7),及它们各自所占的百分比。这里需要注意的是有时会在上游页面和下游页面出现与选择页面相同的URI地址,比如你选择首页(/)进行分析,上游页面和下游页面也出现了首页地址(/),这个主要是刷新操作引起的,GA会把页面刷新统计到Pageviews里面。

  通过上面这个功能,我们就不再需要通过导航页面的离开率(Exit Rate)来粗略估计有多少的Visits留在了网站并可能点击了导航页面的链接。并且通过Navigation Summary我们不仅可以看到有多少Visits从导航页直接离开了,而且可以通过分析导航页的下游页面更加准确地衡量有效点击率,排除那些刷新、返回或者调到其他非导航列表页的操作,将那些导航页面中的链接的点击率(%Clicks)相加,就是该导航页面的有效点击转化(CTR),也就是该导航功能的实现度指标了。以上表为例,排除返回首页(/)、页面刷新(/featured-topics/)及跳转到非导航页面中的页面(/about/、/site-map/等)这些点击,将剩下的实现了导航功能的有效点击率相加就是该导航功能的实现度,可惜GA上的上下游页面都只能显示前10个。

  上面是对前一篇关于优化导航设计的内容的补充,其实页面的上下游分析是一种很有效的网站分析方法,不仅可以用于分析导航实现度,下面介绍一下它的另外一种应用——相关内容推荐效果分析。

网站的相关内容推荐

related-content  博客之前的一篇文章——优化网站信息架构中介绍了大部分的网站可能都是基于树形结构来进行购建的,但是原始的树形结构本身存在一个问题就是叶子节点(或者说是网站的内容节点)之间没有直接的联系,也就是用户无法从一个底层的内容页直接跳转到另外一个底层内容页,需要返回首页或者中间导航索引页面才能进入其他的内容页面,从那篇文章的树形架构图中也有体现,底层页面之间没有直接相连的线条。所以很多网站都会在内容的结尾或侧边栏提供相关内容的推荐,比如亚马逊、淘宝等电子商务网站产品页面会有同类别、同价位的产品推荐,或者是用户在购买该产品的同时也购买了的产品推荐,豆瓣上的书籍、音乐、电影页面也提供了相关内容的推荐。

  这些功能很多都是基于内容相关度的算法来实现的,之前的文章——向上营销、交叉营销与关联推荐介绍过基于用户行为的关联推荐方法。其实很多博客也有类似的功能,即每个文章结尾的相关文章,下图是我的博客的电子商务网站RFM分析这篇文章的相关文章列表:

rfm-related-posts

  我是用Wordpress的插件——Yet Another Related Posts Plugin来实现这个功能的,按照插件的介绍,它是通过计算文章的标题、正文、标签和分类的相关度选取排名前几的显示到页面上。这个功能很棒,它打通了文章页面之间的通道,也许用户在看完一篇文章之后还想浏览下相关的文章,那么相关内容推荐就提供了很好的途径,用户不需要再回退到内容的检索页面,直接点击就行,帮助用户更加方便、快速地定位到想要寻找的信息上。

相关内容推荐效果分析

  网站中的相关内容推荐功能很多都是借助机器算法来自动生成的,所以从某种层度上来说,算法一定会存在优劣,我们需要通过分析来评估功能的实现效果,从而不断地对算法进行优化。而基于用户浏览行为的分析是评估功能实现效果的最有效的方法,所以网站分析又有了用武之地了,上面介绍的Google Analytics上的Navigation Summary就是非常适合用来分析相关内容推荐效果的工具。这里还是以电子商务网站RFM分析这篇文章的上下游页面分析为例看看我使用的这个插件的效果到底怎样:

rfm-navigation-summary

  从上下游页面的列表中查看那些来源于内容页面和去往其他内容页的比例,其中哪些页面的流入和流出的比例最高,然后再与网站相关内容推荐列表中的排名进行比较,这样就能反应网站功能的相关性与用户眼中的相关性是否一致,从而检验功能的实现效果。

  如果进行算法调整,那么同样可以用该方法检验算法调整前后的上下游页面转化比例,从而衡量在算法调整后相关内容推荐功能是否真正得到了优化。而我们要做的就是通过不断优化相关内容推荐的算法使网站内容的相关度排名与用户对内容的预期相关性尽量达成一致,这样才会使页面上显示的相关内容就是用户想要寻找的内容,从而满足用户的需求。

  这里需要注意几个问题:

  1. 也许一个内容页面里面会有不止一处的相关推荐模块,或者会有多处出现其他内容页的链接,在GA的报表上提供的是所有流入流出的总和,所以如果只是评测某一推荐模块的效果,需要区分该模块中的链接,也许加URL参数会是一个解决方案。
  2. 注意数据的时间区间与网站内容的变化带来的相关内容推荐的变化。Google Analytics上默认的时间区间是前一个月,你可以选择合适的区间来进行分析和比较,注意网站内容的更新对相关内容推荐带来的影响。
  3. 有些相关内容间的推荐并不是双向的,比如在购买MP3的页面推荐耳塞,而在购买耳塞的页面可能并不会去推荐MP3,所以有时有必要对上游页面和下游页面分开分析,注意转化的方向性。

  上面就是我想到的Google Analytics的Navigation Summary功能的两个应用实例,你是不是还想到了更多的应用,欢迎分享你的观点。

优化网站导航设计

——让用户更容易地找到需要的信息3

optimize-navigation  之前已经介绍过为了让用户更容易地找到需要的信息,可以对网站的信息架构和站内搜索进行分析和优化,而另一个能对用户起到很好引导作用的就是网站的导航功能,所以这篇文章主要分析用户对网站导航功能的使用情况,并在此基础上合理地优化网站的导航设计。

网站导航的作用

  网站导航的最终目的就是帮助用户找到他们需要的信息,如果说得详细点,那么可以概括为下面3个用处:

  1. 引导用户完成网站各内容页面间的跳转。这个是最常见的,全局导航、局部导航和辅助导航等都是为了引导用户浏览相关的页面;

  2. 理清网站各内容与链接间的联系。即对网站整理内容的一个索引和理解,这个最常见的应用就是网站地图和内容索引表,展现了整个网站的目录信息,帮助用户快速找到相应的内容;

  3. 定位用户在网站中所处的位置。这个在面包屑导航中得到了充分的体现,它帮助用户识别当前浏览的页面与网站整体内容间关系,及其与网站中其它内容的联系和区分。

网站导航的分析

  通过分析用户使用网站导航功能的情况,可以来评估网站各导航功能设计上的优劣,这里主要从导航的利用率实现度有效性符合度4个方面进行分析:

利用率

  网站导航的利用率,即用户使用各类导航功能的情况。最直观的分析方法就是使用点击热图,具体可以参考我之前的文章——网站点击热图,也可以使用页面覆盖图(Overlay),Google Analytics上面默认提供了网站首页的Overlay:

homepage-overlay

  从图中可以区分网站首页各区域导航功能的使用情况,包括顶部导航,侧边栏的各导航模块等。如果是独立的导航索引页面,我们可以查看这些页面的浏览次数(Pageviews)访问量(Visits)等指标来分析它们被使用的情况。比如你通过点击我的博客顶部导航中的“网站地图”进入了分类导航索引页面,会看到该页面的URL地址为http://webdataanalysis.net/site-map/,我们可以在Google Analytics上面通过filter来查看该页面的访问情况:

sitemap-pageview

  通过比较各导航页面的这些指标我们可以分析得到用户对导航功能的整体使用情况以及各导航的使用比例或使用偏好。

实现度

  我们需要知道当用户试图使用导航功能时,有多少用户真正点击导航中的链接或者有多少用户进行了下一步操作。所以这里可以分析各导航页面的点击转化率(CTR),即用户在导航页中的点击次数/导航页面被浏览的次数,其实上面页面覆盖图指直接给出了页面中每个可点击对象的点击转化率,你可以将它们汇总就是整个页面的点击转化率,也可以查看导航页面各链接的点击转化率。但Google Analytics上面无法提供一些子页面的覆盖图,只能选择其它的工具或者试图监控导航页面所有的点击事件。

  另外一种分析导航功能实现度的方法就是通过离开率(Exit Rate)这个指标,如果一个用户进入了导航页面后直接离开了网站,那么导航的功能就没有实现(当然如果用户返回了上层页面或者回到首页,导航功能同样也没有实现,这些操作无法体现在Exit Rate)。比如我的博客的分类目录导航页面,该类页面的URL地址都会包含“/category/”,所以也可以在GA上面直接filter出来所有这类地址,我们看看这些页面的Exit Rate情况,如下图:

category-statistics

  这里因为缺少导航页面Exit Rate的评判基准,所以我无法判断我的导航页面效果到底如何,有兴趣的朋友可以在下面的评论把你们的网站或博客导航页面的Exit Rate贴上来看看,大家交流比较下。

有效性

  与网站的内容页面不同,导航页面的目标是让用户更快地找到想要的信息,我们不需要用户过久地停留在导航页,正如Google的口号:We may be the only people in the world who can say our goal is to have people leave our homepage as quickly as possible(让用户尽快离开自己的网站)。

  所以对于导航页面而言,页面平均停留时间(Avg. Time on Page)越短,则该导航页的质量就越高(当然用户要有点击才行)。页面平均停留时间也是GA中分析页面的基本度量,上图也有显示。

符合度

  或者称为导航的效果,用户在使用导航功能找到相应的页面后,是否对该页面提供的信息感兴趣,或者说这些是不是他们想找的信息。

  假设用户在使用导航功能后找到了需要的信息或者完成了预期的任务,那么在行为可能表现为在使用导航后继续在网站停留了一段时间,或者用户最终到达了任务的成功页面或网站的目标页面(如用户完成注册、电子商务网站下单或购物成功等)。所以我们可以使用导航的后续停留时间任务完成度目标转化率这些分析度量来衡量导航的实现效果到底如何。

  总结一下:

  1. 用点击热图、Pageviews和Visits来衡量各导航的使用情况,点击或浏览越多,说明该导航的利用率就越高;
  2. 用点击转化率(CTR)和离开率(Exit Rate)来衡量导航的实现度,CTR越高、Exit Rate越小,说明导航的实现度越好;
  3. 用页面平均停留时间(Avg. Time on Page)来衡量导航的有效性,用户在页面的停留时间越短,说明导航的功能越有效(基于导航已经拥有较好的实现度);
  4. 用户在使用导航后的停留时间及任务完成度、目标转化率可以衡量导航的符合度,用户的任务完成度或目标转化率越高,则导航的符合度越高。

导航设计的优化

  基于对以上4个方面的分析,我们可以对网站进行针对性的优化。

a) 提高有效导航的利用率,将用户最常用或效果最佳的导航放在最醒目的位置;

  结合上面的分析,将那些利用率高,效果好的导航功能放到醒目的位置,让用户更方便地使用这些功能。

b) 去除无效导航或者无人使用的导航,精简网站设计;

  导航功能并不是越多越好,只要提供够用、有效的导航就行,结合上面的利用率和实现度,将那些没人使用或点击转化较差的导航功能进行精简。

c) 提高导航描述与对应内容的关联度,不要误导用户,赢得用户的信任并保持用户对网站的兴趣;

  不要试图去做标题党,如果一个导航页面拥有了较好的利用率和实现度,那么千万不要辜负用户的期望,为他们提供相符的高质量的内容,这样才能真正地留住用户。

d) 优化导航页面内容的组织和展示。

  如果有效性不高,用户经常需要在导航页中逗留一段时间才能找到自己想要去的地方,那么也许导航页就失去了其最根本的价值。如何更好地展示导航的内容可能是一个复杂的问题,涉及信息设计、分类、排序等多方面,或者有些网站设计师能想出一些别出心裁的展示方式来吸引用户的眼球,这里直接上张图吧:

search-cube

  好了,我对网站导航的分析优化说完了,你是否还有更多高见,欢迎在下面评论分享。

网站页面度量与细分

page-metrics-and-segment 我们在使用一些网站分析工具的时候会发现一般报表会被分成三大模块:用户访问内容浏览流量来源。每个分类都由各种分析度量组成了各类的展示报表,这里先介绍一下内容浏览模块(主要指的是网站的页面浏览)下的各种度量,以及基于这些度量我们可以实现哪些细分。

页面的基本度量

关于一些常见的网站分析度量的定义可以参考我之前的文章——网站分析的基本度量,下面罗列的是一些页面的度量:

页面浏览次数(Pageviews)

页面被打开或请求的次数。

唯一页面浏览次数(Unique Pageviews)

这个是Google Analytics上面使用的一个度量,主要是避免页面的重复加载和刷新导致Pageviews虚高的情况,所以在同一个Visit当中重复打开同一个页面,该页面的Unique Pageviews始终只被记为1次。

访问次数(Visits)

页面的被访问次数,如果按照独立页面来计算每个页面的Visits,其实结果与上面的Unique Pageviews是一致的,所以很多网站能分析工具里面没有Unique Pageviews,而直接用Visits来衡量页面的唯一浏览量。但需要注意的是Visits也常被用作整个网站或者某些内容分类汇总的度量,在这种情况下,网站的总Visits和总Unique Pageviews是不一致的,比如Visit A访问了a-b-a-c4个页面,而Visit B只访问了a-b,那么对于a页面而言,Pageviews是3,Unique Pageviews是2,Visits也是2,但对于这个网站而言,Unique Pageviews是5,而Visits只有2个。

唯一访问用户数(Unique Visitors)

这个应该容易理解,就是进入这个页面的不同IP或者Cookie的个数。

页面停留时间(Time on Page)

用户浏览一个页面时在该页面逗留的时间,在度量页面时,更多的是根据用户取平均值,即页面平均停留时间(Avg. Time on Page)=该页面被浏览的停留时间总和/该页面被浏览次数(GA里面排除了从该页面离开的Pageviews,即Exits)。

直接跳出访问数(Bounces)

也许你可以看到过很多关于这个定义的解释了,一般的网站分析工具,都会将从该页面进入网站并直接离开的访问称为Bounce。而这个度量更多的是以Bounce Rate的形式出现,即从该页面直接跳出的访问数/从该页面进入的访问数。

进入和离开次数(Entrances and Exits)

这个就顾名思义了,从该页面进入、离开的访问数,而一般会以Enter Rate和Exit Rate的形式出现,从该页面进入、离开的访问数/该页面的总访问数。

page-metrics

还有一些其它的页面度量,如新访问用户(New Visits)目标价值(Goal Value)等。

需要关注的页面度量

我们会注意到一般的网站分析工具的结果展现会有许多不同的报表,并且各类报表中又会有重复或不重复的各类度量,当然每张报表可能都会有其不同的展示角度并提供不同的数据分析的用途。但也许我们日常无法全面地关注所有度量,一般都会根据网站的特点着重的关注某些跟网站运营状态息息相关的度量。Google Analytics内容模块的几张报表上一般会展现:

Pageviews、Unique Pageviews、Avg. Time on Page、Bounce Rate、%Exit(离开百分比)及$Index(目标价值指数)

下面列出的是我个人认为对于评价网站页面比较重要的几个度量,或者说是个人比较喜欢和关注的几个度量:

1. 访问量(Visits)或者唯一页面浏览次数(Unique Pageviews)

上面已经对这两个度量进行了介绍,它们对于单个页面而言计算得到的数值是一样的,只会在计算汇总的时候存在差异。那么为什么选择访问量,而不是页面浏览数或者唯一用户数呢?我的理解是在同一个Visit中,如果用户多次浏览同一页面,那么很有可能使用户喜欢刷新或重载页面,或者用户习惯于倒退操作而重复穿梭于你的网站,所以这些重复浏览对于评价页面的优劣比较没有意义;而如果是不同的Visit,即使是同一用户浏览了同一页面,那么我们更多地可以理解为用户对于上次看到的内容意犹未尽,想再仔细研究个究竟,这种页面浏览对于评价一个页面是有效的,所以我更偏向于选择页面的访问量Visits。

2. 崩失率(Bounce Rate)

好吧,无论你怎么称呼它,都不得不承认它的魅力十足,网站有很多相关的文章,在我的博客之前也写过一篇——关于Bounce Rate定义的疑问

对于它的价值我是这样理解的,用户会直接跳出,无非3种情况:1.误闯;2.内容过于乏味;3.进入的页面也是网站的出口。所以在关注Bounce Rate的时候有必要进行特殊情况特殊分析,比如网站首页的Bounce相对比较高是可以理解的,因为作为网站最前端的大门,可能会有相当一部分用户误闯了进来;而网站的底层内容细节页面的Bounce Rate比较高有可能用户直接进入该页面,找到了需要的信息并离开了,也就是上面所说的第3种情况。而排除这两种特殊的访问,如果其他页面的Bounce Rate偏高,那么说明该页面有问题了。

3. 页面平均停留时间(Avg. Time on Page)

这个应该比较容易理解,用户需要获取你页面中的某些信息就会需要一定的浏览时间,当然根据页面提供的内容的长短和复杂度,平均停留时间也会存在一定的差异,但我们不需要关注这类情况,我们只需要揪出那些平均停留时间短到用户几乎无法对页面内容作出有效反应就已经离开了的那些页面,毫无疑问这些页面是有问题的。

页面细分

基于上面介绍的这些度量,我们可以选择任何的单个或者多个来对页面进行细分,我想到的有以下结果细分的方法:

基于Pageviews、Unique Pageviews、UniqueVisitors区分热门页面和冷门页面;

基于Avg. Time on Page区分有趣的内容和乏味的内容;

基于Bounce Rate及下一浏览页面的多样性来区分病态页面和枢纽页面;

基于Enter Rate和Exit Rate来识别网站的入口和出口页面;

……

当然,你还可以想到很多种其他细分的方法,只要细分的结果对你的网站而言是有价值的。这里举个简单的用多个度量组合进行细分的例子,选取的度量就是上面3个我认为值得关注的页面度量。既然涉及3个度量,大部分的平面坐标系的图表无法很好的展示,也许你也跟我一样想到了一类图表——气泡图,下面是一个简单展示:

page-segment-xlbubble

横坐标标识访问量,纵坐标标识Bounce Rate,气泡的半径r标识页面平均停留时间,我们可以将页面细分成4类,分别对应4个象限,其中:

第一象限:较高的访问量和Bounce Rate,所以页面比较热门但并不能吸引所有进入的用户,也许你的网站的首页或者Landing Page正是处于这一象限,你可能需要优化下SEO的关键词或者购买相关性更高的广告或者关键词,也可以优化下你的首页和Landing Page,让它们更具吸引力以留住用户;

第二象限:如果你的网站有很多页面处于这个象限,那么你的网站正处在一个糟糕的状况下,而往往这一象限内的气泡也会比较小;

第三象限:其实在这一象限的某些页面是可以通过提升曝光率来提升它们的访问量,因为从Bounce Rate来看它们并不缺少吸引力;当然,如果某些内容只针对特定人群,而其他人群对它们的兴趣不高,那么处于第三象限也是一个正常的状况;

第四象限:这些页面集中了你的网站的一些黄金内容,看看它们到底在哪些方面吸引了这么多的用户,让其他页面也学习一下它们。

也许你还能想到其它更加有趣的页面细分方法,欢迎与我分享交流。

网站点击热图(Heat Map)

  网站分析通过统计点击流数据及网站产生的其他各类数据,提供各种数据报表来监控网站的运营状态,为网站的优化和改进提供参考依据。但网站分析能提供的绝不仅有数据,其中点击热图(Heat Map)是对网站分析的一个很好的扩充,目前网上介绍点击热图的文章也比较多,很多网站交互设计师用点击热图来评估用户与网站之间的交互状况从而改善用户体验。这里简单介绍几个点击热图的实现工具以及用我的博客做的点击热图的实验。

几款点击热图工具

  Sidney的博客中很早以前就介绍过一款点击热图的分析工具——Crazy Egg令人惊讶的优秀网站分析工具,文章是由Tenly写的。另外网上介绍比较多的点击热图工具还有ClickTabletealeaf,这些工具都是通过JS来实现的,只要在相应的页面上嵌入JS代码,就能在这些工具的网站上查看该页面的点击效果图,实现机制跟Google Analytics较为类似。这些工具一般都需要收费,但会有1个月的免费试用期,有兴趣的可以去试试。

  另外有一款开源的工具——ClickHeat,可以下载它的源代码部署到自己的服务器上,并在网站页面中嵌入相应的JS代码来生成点击热图,然后通过调用相应的页面查看。要部署ClickHeat,服务器需要支持PHP,同时因为点击的日志和所有统计结果都保存到了部署的服务器上,所以对服务器的空间和资源占用都比较高。

点击热图应用实例

  前段时间用我的博客做了下网站点击热图的试用实验,我用的是Click Density,跟ClickTable和Crazy Egg类似,也是通过嵌入JS的方法来实现的,在结果的输出页面可以选择点击的时间段、浏览器类型等条件对结果进行筛选,下面的生成的几张点击效果图:

Heat Map

heat-map

  因为我的博客访问量不大,所以热图的分布不是很明显,但还是能看出主要的点击集中在博客最新的文章上面;另外右侧的搜索、订阅和分类目录模块也占据了一定的点击比例。一般网站的点击都会聚集在全局导航栏的下面那一块,并且呈“F”型分布,在需要下拉的页面部分点击一般就会剧减(对于需要下拉查看的内容,除非用户找到了他们需要的信息,否则一般不会过多地进行点击)。

Click Map

click-map

  这张是点击分布图,红叉代表无效的点击,绿叉代表有效点击。这个图似乎比上面单纯的显示点击分布或点击密度更有价值,因为它显示了页面的有效点击,从图上可以看出用户在浏览我的博客时除了点击文章标题和搜索框外,订阅按钮上面也分布了大量的有效点击数,这个对于博客来说至关重要,因为博客类网站的一个重要目标就是产生订阅,所以通过这个图可以查看有多少有效点击转化成了网站目标,占总的点击比例及占总的有效点击的比例。

  另外可以看到图上的某些有效点击并非一定落在可点击的对象上,正是因为博客内容更新时导致页面元素(标题位置、内容摘要行数等)的偏移,而生成的点击不会跟随页面元素移动,导致了生成图片显示上的误差。

Hover Map

hover-map

  这个图其实相当与网页覆盖图(Overlay)或点击密度图(Click density),Google Analytics上面也提供了类似的功能。网页上可点击的位置会由虚线框圈起来,鼠标放到某个框上面就会显示该模块被点击的次数及点击转化率(CTR);另外如果你为你的网站设定了目标,那么同时也会显示点击该模块的目标转化率,对于分析网站的重要页面是个不错的选择。

点击热图的价值及缺陷

点击热图的价值

  1. 通过点击热图发现用户经常点击的模块或聚焦的内容;
  2. 观察页面中的哪些模块具有较高的有效点击数,用户会尝试去点击哪些模块;
  3. 应用于A/B测试,比较不同页面的点击分布情况;
  4. 用于改进网站交互和用户体验。

点击热图的缺陷

  1. 网站点击热图虽然提供了一种很直观的网站分析途径,但其功能还需完善,因为实现机制一般都是根据页面的坐标来定位点击位置,所以不同的分辨率和网站布局方式(居中等)都会导致结果的不准确;
  2. 在使用点击热图时需要记录用户每次点击的行为,所以会对网页的性能产生影响,导致网页的加载速度变慢;
  3. 当页面各元素的位置发生大范围变动时,点击热图的结果就失效了。

  最后顺便提一下,我的博客之前的一篇文章——网站数据分析的基本流程中介绍了DMAIC模型,当时我是在查PDCA戴明环的相关资料的时候不经意间发现的,感觉很适用于网站分析的流程。前几天在翻Avinash Kaushik的《Web Analytics》,发现书中也介绍了DMAIC模型,所以感觉DMAIC确实是梳理网站分析流程的一个不错的选择。