月度归档：2010 年五月

优化网站内部搜索

——让用户更容易地找到需要的信息2

　　关于如何让用户更容易地找到需要的信息，上一篇文章中介绍了使用优化网站信息架构的方式，这篇文章主要介绍的是通过优化站内搜索的方式来帮助用户找到需要的信息。

　　站内搜索已经成为目前几乎所有网站必不可少的一块功能，尤其在内容丰富的网站中，当用户有目的地寻找目标内容但又无法直接从首页或导航页中直接找到时，这时用户就会求助于站内搜索。

分析站内搜索的意义

　　分析站内搜索最常见的就是分析用户的搜索短语或者关键词，通过关键词了解用户的需求，但是某些基于搜索后的用户操作和行为分析分析往往更有价值；站内搜索的意义主要包括以下几点：

细化用户需求

　　用户在站内搜索的关键词往往与站外搜索有较大区别，比如用户可能会通过Google搜索“ThinkPad笔记本”，但当用户进入某个销售笔记本电脑的电子商务网站时，他们通过站内搜索的往往就是诸如“ThinkPad X200”，所以从站内搜索分析得到的关键词往往更能体现用户更细节层面的需求。

发现用户最关注的内容

　　这是一种最直观的分析结果意义的体现，即通过查看站内搜索关键词的排名或者热门程度来了解用户在你的网站上最关注于哪些信息，往往这些排名靠前的关键词所涉及的内容就是网站的核心价值，因为用户期望看到更多的关于这些方面的内容。

寻找用户的潜在需求

　　很明显，站内搜索并非每次都会有结果，用户的需求是多样的，而网站的内容是有限的。如果用户通过站内搜索未找到结果或者没有后续操作，或者一直翻页直到离开，那么就说明用户没有找到他们需要的信息。而这些没有结果或没有操作的关键词就变成了用户可能的潜在需求，也许你该考虑下是不是该提供一些相关的内容来充实你的网站。

站内搜索的分析度量

　　那么为了体现以上的几个意义，应该如何分析站内搜索？也许站内搜索不仅是搜索短语或者关键词的排名，我们应该同时关注用户搜索行为的后续操作，也就是用户是不是真正通过站内搜索找到了他们需要的信息，所以在分析站内搜索的时候我们需要关注一些相关的度量。先看看Google Analytics上站内搜索的分析度量：

搜索访问次数（Visits with Search）

　　这个很好理解，就是使用了站内搜索的访问数（Visits）。

唯一搜索总次数（Total Unique Searches）

　　这个应该理解为每个Session搜索唯一关键词的总次数之和，同一个session中多次搜索同一个搜索关键词只会被记为一次，可以被用于根据搜索短语的细分度量。

结果页面浏览数/搜索次数（Results Pageviews/Search）

　　也就是平均每次搜索后浏览搜索结果列表页面数。

搜索退出率（Search Exits）

　　搜索退出，即搜索后立即退出了网站，搜索操作是用户该次浏览的最后一个操作；那么搜索退出率就是搜索退出访问数/总搜索访问数。

搜索改进率（Search Refinements）

　　当用户完成一次搜索后又进行了另一次的搜索，我们就可以定义后一步搜索是改进搜索；那么搜索改进率就是改进搜索的次数/总的搜索次数。

搜索后平均停留时间（Time after Search）

　　每次搜索后用户在网站的停留时间（如果一个访问有多次搜索，则前几次搜索都是每相邻两次搜索的间隔时间，最后一次搜索是从搜索到用户离开网站的时间）的总和/搜索访问数。

搜索后平均浏览页面数（Search Depth）

　　每次搜索后用户浏览的页面数（如果一个访问有多次搜索，则前几次搜索都是每相邻两次搜索间浏览的页面数，最后一次搜索是从搜索到用户离开网站前浏览的页面数）的总和/搜索访问数。

　　站内搜索的分析度量可能还有很多，还需要关注搜索关键短语的排名情况（Top Key Phrases），或者搜索结果列表的页面覆盖图（search results page overlay），这个可以更好地帮你了解搜索关键词在结果页面的曝光和点击情况。

评估站内搜索的效率

　　有了上述的度量，我们就可以分析和评价站内搜索的效率。

站内搜索利用率

　　这个比较容易评价，只要将用到搜索的访问数/网站的总访问数，就是站内搜索的利用率。

站内搜索的有效性

　　这是对站内搜索来说比较重要的一个分析，即站内搜索到底有没有很好地实现它的功能。主要通过搜索退出率、搜索改进率和平均浏览搜索结果页面数这3个度量来评价，退出率和改进率越低，同时平均浏览搜索结果页面数越少，那么说明站内搜索越有效，效率越高。

站内搜索的效果

　　主要通过搜索后平均停留时间和平均浏览页面数来评价站内搜索的效果，但这些因素往往不是站内搜索功能呢个本身所能控制的，站内搜索只是帮助用户更好地匹配搜索关键词跟网站内容的关系，帮助用户找到相关的内容，至于之后用户对内容的兴趣如何还得看网站本身的内容质量。

站内搜索的价值

　　当评估价值时，不得不提到的几个网站分析度量：转化率（Conversion Rate），任务完成度（Task Completion），目标达到率（Reach Object）。

　　对于电子商务网站而言，这个评价较为简单，因为电子商务网站的目标比较单一——利润，所以只要分析用户每次搜索的订单转化率、交易完成率，及每次搜索所能获取的收益等就可以用于评估内部搜索对于网站的价值，当然你还能根据搜索的关键词进行细分，看看哪些关键词为你带来的最大的收益。

　　如果网站没有明确而单一的目标，那么评价内部搜索的价值就会有些困难，但是如果你在Google Analytics上设置的网站目标，那么问题就会简单得多，Google Analytics会根据你设置的目标帮你计算出每次搜索到达目标的次数，目标的转化率及平均每次搜索的目标价值（如果你为每个目标设置了价值指数的话）。

优化站内搜索

　　通过分析站内搜索，我们可以根据以上各度量的结果对网站的搜索功能进行针对性的优化。

优化结果排序

　　当网站的平均浏览搜索结果页面数偏高时，我们需要关注下是不是站内搜索的结果排序存在问题。我们可以看到很多网站的搜索结果提供了排序选择功能，这里看一下Wordpress网站的插件搜索页面：

　　这里提供了5中搜索结果排序方式可供选择：相关性、最高评分、最新发布、最近更新和最热门插件，但发现即使提供了这么多种排序方式，我有时还是搜索不到自己想要的插件，也许我会想要对结果进行相关性和最高评分的组合排序。

　　但优化结果排序最关键的还是对默认排序的优化，用户在点击搜索按钮之后都会愿意看到结果列表中显示的是最符合搜索预期的内容，也就是他最感兴趣的内容，那么对于他找到自己想要的信息当然是最有力的。所以，尽量减少用户的多余操作（自己选择合适的排序方式），一开始就帮用户做到最好。

优化信息设计

　　信息设计是指对信息的分类、整理和罗列的过程，对于一个内容丰富、分类繁多的网站而言，提供系统清晰的信息设计，可以让信息的检索事半功倍。

　　我们分析搜索改进度量的时候，如果发现用户的搜索改进一般都是在区分信息的分类或者改进关键词的细节表述，那么这时候可以考虑为用户提供搜索结果筛选的功能，如太平洋上面提供了极为丰富的信息筛选功能：

同义词与结果推荐

　　用户在输入搜索关键词的时候有时会拼写错误，或者用户可能输入的是模糊定义的短语，这些可以直接分析站内搜索关键词及搜索改进等来确认你的网站用户是不是普遍存在这类行为，所以我们需要为用户提供一些关键词的改进建议及结果的推荐，下面是我在淘宝中输入“诺记亚”进行搜索时它为我提供的搜索建议：

　　所以，站内搜索可以说是一个比较复杂的功能，尤其是想把它优化的更好的时候，所以很多大的公司有专门的团队来研究和改进站内搜索功能。建议在优化站内搜索的时候考虑使用网站分析的方法让优化的工作具有更加明确的目标和方面，同时通过比较优化前后网站分析中相应的度量，可以为优化的效果提供有力的量化参考指标。

网站页面度量与细分

20 条回复

我们在使用一些网站分析工具的时候会发现一般报表会被分成三大模块：用户访问、内容浏览和流量来源。每个分类都由各种分析度量组成了各类的展示报表，这里先介绍一下内容浏览模块（主要指的是网站的页面浏览）下的各种度量，以及基于这些度量我们可以实现哪些细分。

页面的基本度量

关于一些常见的网站分析度量的定义可以参考我之前的文章——网站分析的基本度量，下面罗列的是一些页面的度量：

页面浏览次数（Pageviews）

页面被打开或请求的次数。

唯一页面浏览次数（Unique Pageviews）

这个是Google Analytics上面使用的一个度量，主要是避免页面的重复加载和刷新导致Pageviews虚高的情况，所以在同一个Visit当中重复打开同一个页面，该页面的Unique Pageviews始终只被记为1次。

访问次数（Visits）

页面的被访问次数，如果按照独立页面来计算每个页面的Visits，其实结果与上面的Unique Pageviews是一致的，所以很多网站能分析工具里面没有Unique Pageviews，而直接用Visits来衡量页面的唯一浏览量。但需要注意的是Visits也常被用作整个网站或者某些内容分类汇总的度量，在这种情况下，网站的总Visits和总Unique Pageviews是不一致的，比如Visit A访问了a-b-a-c4个页面，而Visit B只访问了a-b，那么对于a页面而言，Pageviews是3，Unique Pageviews是2，Visits也是2，但对于这个网站而言，Unique Pageviews是5，而Visits只有2个。

唯一访问用户数（Unique Visitors）

这个应该容易理解，就是进入这个页面的不同IP或者Cookie的个数。

页面停留时间（Time on Page）

用户浏览一个页面时在该页面逗留的时间，在度量页面时，更多的是根据用户取平均值，即页面平均停留时间（Avg. Time on Page）=该页面被浏览的停留时间总和/该页面被浏览次数（GA里面排除了从该页面离开的Pageviews，即Exits）。

直接跳出访问数（Bounces）

也许你可以看到过很多关于这个定义的解释了，一般的网站分析工具，都会将从该页面进入网站并直接离开的访问称为Bounce。而这个度量更多的是以Bounce Rate的形式出现，即从该页面直接跳出的访问数/从该页面进入的访问数。

进入和离开次数（Entrances and Exits）

这个就顾名思义了，从该页面进入、离开的访问数，而一般会以Enter Rate和Exit Rate的形式出现，从该页面进入、离开的访问数/该页面的总访问数。

还有一些其它的页面度量，如新访问用户（New Visits）、目标价值（Goal Value）等。

需要关注的页面度量

我们会注意到一般的网站分析工具的结果展现会有许多不同的报表，并且各类报表中又会有重复或不重复的各类度量，当然每张报表可能都会有其不同的展示角度并提供不同的数据分析的用途。但也许我们日常无法全面地关注所有度量，一般都会根据网站的特点着重的关注某些跟网站运营状态息息相关的度量。Google Analytics内容模块的几张报表上一般会展现：

Pageviews、Unique Pageviews、Avg. Time on Page、Bounce Rate、%Exit（离开百分比）及$Index（目标价值指数）

下面列出的是我个人认为对于评价网站页面比较重要的几个度量，或者说是个人比较喜欢和关注的几个度量：

1. 访问量（Visits）或者唯一页面浏览次数（Unique Pageviews）

上面已经对这两个度量进行了介绍，它们对于单个页面而言计算得到的数值是一样的，只会在计算汇总的时候存在差异。那么为什么选择访问量，而不是页面浏览数或者唯一用户数呢？我的理解是在同一个Visit中，如果用户多次浏览同一页面，那么很有可能使用户喜欢刷新或重载页面，或者用户习惯于倒退操作而重复穿梭于你的网站，所以这些重复浏览对于评价页面的优劣比较没有意义；而如果是不同的Visit，即使是同一用户浏览了同一页面，那么我们更多地可以理解为用户对于上次看到的内容意犹未尽，想再仔细研究个究竟，这种页面浏览对于评价一个页面是有效的，所以我更偏向于选择页面的访问量Visits。

2. 崩失率（Bounce Rate）

好吧，无论你怎么称呼它，都不得不承认它的魅力十足，网站有很多相关的文章，在我的博客之前也写过一篇——关于Bounce Rate定义的疑问。

对于它的价值我是这样理解的，用户会直接跳出，无非3种情况：1.误闯；2.内容过于乏味；3.进入的页面也是网站的出口。所以在关注Bounce Rate的时候有必要进行特殊情况特殊分析，比如网站首页的Bounce相对比较高是可以理解的，因为作为网站最前端的大门，可能会有相当一部分用户误闯了进来；而网站的底层内容细节页面的Bounce Rate比较高有可能用户直接进入该页面，找到了需要的信息并离开了，也就是上面所说的第3种情况。而排除这两种特殊的访问，如果其他页面的Bounce Rate偏高，那么说明该页面有问题了。

3. 页面平均停留时间（Avg. Time on Page）

这个应该比较容易理解，用户需要获取你页面中的某些信息就会需要一定的浏览时间，当然根据页面提供的内容的长短和复杂度，平均停留时间也会存在一定的差异，但我们不需要关注这类情况，我们只需要揪出那些平均停留时间短到用户几乎无法对页面内容作出有效反应就已经离开了的那些页面，毫无疑问这些页面是有问题的。

页面细分

基于上面介绍的这些度量，我们可以选择任何的单个或者多个来对页面进行细分，我想到的有以下结果细分的方法：

基于Pageviews、Unique Pageviews、UniqueVisitors区分热门页面和冷门页面；

基于Avg. Time on Page区分有趣的内容和乏味的内容；

基于Bounce Rate及下一浏览页面的多样性来区分病态页面和枢纽页面；

基于Enter Rate和Exit Rate来识别网站的入口和出口页面；

……

当然，你还可以想到很多种其他细分的方法，只要细分的结果对你的网站而言是有价值的。这里举个简单的用多个度量组合进行细分的例子，选取的度量就是上面3个我认为值得关注的页面度量。既然涉及3个度量，大部分的平面坐标系的图表无法很好的展示，也许你也跟我一样想到了一类图表——气泡图，下面是一个简单展示：

横坐标标识访问量，纵坐标标识Bounce Rate，气泡的半径r标识页面平均停留时间，我们可以将页面细分成4类，分别对应4个象限，其中：

第一象限：较高的访问量和Bounce Rate，所以页面比较热门但并不能吸引所有进入的用户，也许你的网站的首页或者Landing Page正是处于这一象限，你可能需要优化下SEO的关键词或者购买相关性更高的广告或者关键词，也可以优化下你的首页和Landing Page，让它们更具吸引力以留住用户；

第二象限：如果你的网站有很多页面处于这个象限，那么你的网站正处在一个糟糕的状况下，而往往这一象限内的气泡也会比较小；

第三象限：其实在这一象限的某些页面是可以通过提升曝光率来提升它们的访问量，因为从Bounce Rate来看它们并不缺少吸引力；当然，如果某些内容只针对特定人群，而其他人群对它们的兴趣不高，那么处于第三象限也是一个正常的状况；

第四象限：这些页面集中了你的网站的一些黄金内容，看看它们到底在哪些方面吸引了这么多的用户，让其他页面也学习一下它们。

也许你还能想到其它更加有趣的页面细分方法，欢迎与我分享交流。

优化网站信息架构

36 条回复

——让用户更容易地找到需要的信息1

　　最近突然想写个专题类的文章，关于如何让用户更方便快捷地在网站上寻找到他们需要的信息，当然不能脱离博客的主题——网站数据分析，所以这里主要介绍的是如何通过网站分析来优化网站，实现用户对信息的快速获取，首先介绍的是网站的信息架构。

　　关于信息架构，网站设计的同学才是专家，我在这里只是班门弄斧，根据大学里面阅读的信息架构类文献资料的一些残存的记忆，再加上这几天临时抱佛脚的简单温习，在这里表述一下我的一点拙见。

信息架构的定义

　　根据维基百科的定义，信息架构（Information Architecture，简称IA）是在信息环境中，影响系统组织、导览、及分类标签的组合结构。它是基于信息架构方法论，并运用计算机技术管理和组织信息的一个专门学科。信息架构并非一开始就应用于网站设计，其起源于情报科学，最初应该是用于图书馆等地方的信息组织和信息检索的。

　　《用户体验的要素——以用户为中心的WEB设计》这本书中对信息架构的定义基于网站设计：信息架构着重于设计组织分类和导航的结构，从而让用户可以提高效率、有效地浏览网站的内容。

　　具体的就不再多说的，可能各有各的理解，这里直接来看一个实例——Wordpress的信息架构模式：

　　当然，上面这个图只能展示一个大体的网站信息架构，中间的类目层也许不止一层，会有大类、子类、子子类……底层可以是文章也可能是页面或者一些其他的具体内容。而网站的内部关系也往往因为全局或局部导航、网站内链和内容关联等功能的存在而复杂的多，图上的箭头也会密集很多，但我们无需罗列所有内容间的关系，关键是在理清基本的结构。

信息架构的类型

　　还是参考《用户体验的要素——以用户为中心的WEB设计》中对信息架构的几个分类：

层次结构（Hierarchical Structure）

　　也叫树形结构，是最常见的网站信息架构模式，上面举例的Wordpress的信息架构就是典型的层次结构。树形结构中箭头的方向不一定是自上而下的，也可能是自下而上或者是双向的，而内容层之间也会因为一些关联链接的存在而存在同层次间的指向箭头。

矩阵结构（Matrix Structure）

　　矩阵结构比较注重“维”的概念，即从多维的角度来检索信息，如时间、地域、内容分类等，典型的应用就是内容管理系统（CMS）网站或者电子商务类网站，比如你浏览豆瓣的电影时可以筛选：2010年—美国—科幻，也许这个时候《钢铁侠2》就呈现在你面前了。

线性结构（Sequential Structure）

　　看到线性结构也许你马上会想到面包屑，它将网站中最重要的一个信息架构路线展现了出来，即使它无法为你提供你在网站上的平面坐标，但至少它显示了你现在正处于关键线路的哪个点上；当然，网站的一些关键路径一般也是按照线性结构涉及的，比如用户注册流程或电子商务网站的购买流程等。

网站分析与信息架构

　　根据网站业务模式的不同，可以选择适合自己网站的信息架构的模式，无论是上面的哪种信息架构模式，只要设计和运用合理，用户便能够在你的网站上以最方便的形式、最快的速度找到他们需要的信息。

　　但当我浏览某些网站时，有时真的会让我感觉到“找不到北”，结果就是直接关闭该页面，如果不希望让已经进入了你的网站的用户轻易地离开，网站信息架构的好坏将直接影响网站的用户体验。所以我们需要通过一些方法来检验网站的信息架构是否满足用户的信息检索的需求。

1.尝试整理出类似上面例子中的网站信息架构图

　　这个是最简单最直观的方法，如果你的网站信息架构足够清晰，那么画出这样的图对你来说也绝非难事；而当网站的应用比较复杂、内容比较宽泛，那么可能要整理出网站的整体信息架构就会相对困难，但我相信一个设计优秀的网站只要稍加整理，大体的信息架构图还是画得出来的；而当你绞尽脑汁就是理不清你的网站的信息架构的头绪的时候，那么说明你的网站需要优化了。

2.通过网站分析的方法验证信息架构的合理性

　　本文的副标题是“让用户更容易地找到需要的信息”，所以我们需要分析用户是否能够在你的网站上方便快捷地找到他们需要的信息，这里推荐一种方法——寻找网站中的迷失用户（Lost Visits）。

　　在一个合理的信息架构下，大多数的用户是不会在你的网站上迷路的；反之，混乱的信息架构会导致大量的用户迷失方向，就像是进入了一个巨大的迷宫。那么如何寻找这些迷失用户？我们可以先分析下这类用户的行为，最明显特征的就是：连续点击好几个页面，每个页面都只是初步浏览（因为没有找到他们需要的信息）就转到另外的页面或直接离开了。所以我们可以借助网站分析中的两个度量：

　　浏览页面数（Depth of Visit）：一次访问中用户总的浏览页面数；

　　页面平均停留时间（Avg. Time on Page）：一次浏览中用户在每个页面的平均停留时间，即该次访问总停留时间（Time on Site）/该次访问页面数（Depth of Visit）。

　　我们可以用户细分的方法把那些浏览页面数较多，但页面平均停留时间较短的用户浏览看作是迷失用户，具体的数值可以根据网站自身的特点进行定义，比如我定义我的博客中浏览页面数大于等于4，而页面平均停留时间小于等于15秒的Visits为迷失用户的浏览行为，我们可以借助Google Analytics中的高级群组（Advanced Segment）来区分出这类用户，关于如何使用Google Analytics的高级群组功能，可以参考蓝鲸的文章——Google Analytics功能篇—高级群组，如下图：

　　当然，你可能会说这种用户区分的方法不准确，这类用户不一定就是迷失用户，也有可能他们确实找到并浏览了具体内容，但因为内容不够吸引人或者其他原因而马上离开了该页面。所以这里用高级群组划分出来的这类Visits的数量不能看作是迷失用户的一个绝对数值，我们只能认为里面的大部分Visits都是迷失用户，而不排除存在某些另类。所以更合理的方法是通过计算这类Visits占网站总Visits的比例情况来分析网站的信息架构到底是否合理，我们可以在Google Analytics上面选取网站的All Visits和Lost Visits进行比例和趋势的比较，如下图：

　　网站中迷失用户浏览的所占比例只需通过Lost Visits/All Visits就可以计算得到，但这个时候你还是无法根据这个计算结果来评判网站的信息架构到底是好是坏，因为还缺少一个基准线（Benchmark）或者说是评判标准。在Google Analytics上面的Visitors标签下，提供了“Sites of similar size”的基准比较（Benchmarking），你可以选择与你的网站相似类型的网站作为基准线进行数据比较，这的确是个很好的参考，因为通过比较能够更加明确你的网站在同类型网站中的优势和劣势，为网站优化指明方向。GA借助其强大的数据平台可以为我们提供基准线，但也许对于上面这个例子会显得无能为力，这个时候需要我们理性地自己去选择一个合适的基准线，比如我的博客目前类目和内容都还比较少，那么我可能会定义我的网站的迷失用户比例应该控制在1%以下；但如果对于一个应用和内容比较复杂的网站，那么基准线显然会需要定得更高一点。一旦某段时间的数据越过了基准线，就需要关注一下网站的信息架构是不是在趋于混乱了，是不是该进行一下整理和优化了。

　　总之，一个好的信息架构能够帮助用户更容易地找到他们需要的信息，从而有效地提升网站的用户体验，所以，尝试着去优化下你的网站的信息架构。如果你有更好的方法能够有效地检验网站的信息架构的优劣，或者能够明确地分析得到网站信息架构的哪些细节上存在缺陷，希望能与我交流，我期待网站分析方法在优化网站信息架构方面的更多的应用。

NoJS的网站数据统计

19 条回复

　　目前主流的网站分析工具都是通过JavaScript来实现数据的获取的，如Google Analytics就是通过在网页中嵌入一段JS代码，当该网页被浏览时，JS代码被加载，就会向Google Analytics的数据收集服务器发送用户浏览该网页的相应数据，包括时间、IP、页面URL、Session、Cookie等信息，Google Analytics后台通过处理和计算这些收集到的数据，将每天的网站统计结果展示在WEB报表上。

　　但是不是所有的页面都支持JS的，让我开始关注到这个问题的原因就是博客的Feed页面。我发现我的博客在AWstats上统计到的数据显示我的Feed页面是我的博客中PV最高的页面，如下图：

　　但是在Google Analytics的Content统计中却找不到Feed页面的任何数据，当然AWStats是通过网站日志实现统计的，包括搜索引擎爬虫和RSS订阅器的抓取记录，PV偏高也可以理解；但除了搜索引擎爬虫和RSS订阅器外，用户也会浏览Feed页面，GA即使无法统计到网络爬虫，但没有Feed页面的任何统计数据也是不正常的，最后终于找到了问题所在，也许大家都已经想到了，Feed页面其实是以XML的形式存在的，其中无法嵌入JS代码，于是GA上无法统计到相关的数据。也许我们在其他地方也会遇到此类无法加载JS代码的统计情况，于是我开始寻找不使用JavaScript实现使用Google Analytics实现统计的方法……

　　Google Analytics without Javascript（简称 NoJSStats）是一款使用 Google Analytics 的第三方统计工具，部署在Google App Engine上授权免费使用，通过在页面嵌入一个1像素的图片来统计页面流量，主要用于在不支持 Javascript 的环境下使用 Google Analytics 统计服务。

NoJSStats的用途

统计不支持JS的手机浏览器的访问；
统计“禁用JS”功能的浏览器的访问；
统计第三方平台上的访问流量，如非独立博客、淘宝店铺、论坛等；
统计博客的 Feed 访问；
统计 Email 的打开和浏览情况（这个对掌握直邮营销的效果很有用）。

NoJSStats的使用

　　如果你喜欢翻墙，可以直接参考上面的NoJSStats页面链接。NoJSStats的使用十分简单，就是在你想要统计的页面或者模块中嵌入一个1像素的透明图片即可，不会影响正常的页面展现和浏览。图片的URL链接地址是：

http://nojsstats.appspot.com/你的GoogleAnalytics账号/网站主页URL

　　比如我的博客的图片获取链接是：

http://nojsstats.appspot.com/UA-13232982-1/webdataanalysis.net

　　你可以在想要获得统计数据的地方嵌入该图片，如：

网页HTML：<img src=”http://nojsstats.appspot.com/UA-123456/mywebsite.com” />

论坛：[img]http://nojsstats.appspot.com/UA-123456/mywebsite.com[/img]

CSS：body{ background: url(“http://nojsstats.appspot.com/UA-123456/mywebsite.com”); }

　　如果你的网站使用SSL加密，那么请使用以下的图片链接：

httpS://nojsstats.appspot.com/UA-123456/yourwebsite.com

　　使用NoJSStats可以统计博客Feed的文章被浏览的情况，只要修改Wordpress的主题目录下的functions.php的文件，加入如下代码：

<?php
add_filter('the_content', 'google_analytics_for_feed',99);
function google_analytics_for_feed($content){
    if (is_feed()) {   //只在feed输出中嵌入图片
        $content.= '<img src="http://nojsstats.appspot.com/UA-13232982-1/webdataanalysis.net" alt="" />';
    }
    return $content;
}
?>

　　我们可以在Google Analytics的报表上面看到Feed页面的相关统计数据了：

　　这里需要注意的是上面这段代码实现了在Feed中的每篇文章内容的最后添加了透明图片，所以当任何一篇文章被展示时，Google Analytics上面就会增加一个Pageview，所以这里的Pageview不能认为是页面被浏览次数，而是浏览的文章总数。当一个页面或某个RSS阅读器中显示5篇Feed模板上的文章时，那么该页面被浏览一次其实Pageviews就会加5。同时网络爬虫和RSS的抓取不会发送图片请求，所以不会被统计在内，所以通过NoJSStats统计得到的数据基本可以认为是用户的浏览行为，并且包括用户从RSS阅读器阅读文章或其他网站从Feed上转载文章的浏览情况，这些数据对于博客而言都是十分具有参考价值的。

NoJSStats的实现机制

　　通过上面的介绍和使用，也许大家已经意识到了NoJSStats的实现机制就是网站分析中点击流数据获取的方式之一——Web Beacons，即在页面中嵌入一个1像素的透明图片，当该页面被浏览时，图片就会被请求加载，于是在后端的服务器日志中就会记录该图片的请求日志，如打开我的博客首页，右上角的Logo图片就会被请求，这样就可以获得如下的日志记录：

60.216.235.23 – - [09/May/2010:15:09:12 +0800] “GET /wp-content/themes/cordobo-green-park-2/img/logo.png HTTP/1.1″ 200 35715 “http://webdataanalysis.net/” “Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 2.0.50727; TheWorld)”

　　请求类型是GET，请求的资源就是该图片的URI，而后面的referrer中记录了我的博客的首页URL，即用户浏览的页面（关于网站日志格式的相关资料可以参考我之前的一篇文章——WEB日志格式），所以只要统计出现这类图片请求的日志记录就能获得嵌入图片的各页面被浏览的情况，Web Beacons就是通过这种方式来获取用户的浏览数据的。需要注意的是，Web Beacons方式是无法获取浏览的来源页面信息的，除非在图片的URI请求中带上referrer的参数，类似.gif?ref=www.google.com。

　　而NoJSStats还有一点让我比较迷惑的就是既然没有JS的支持，同时referrer字段又被浏览的当前页面占据，那么就无法区分用户浏览的session，也就是无法实现Visits的统计，但直接打开http://nojsstats.appspot.com/UA-13232982-1/webdataanalysis.net这个链接（很奇怪，这个没有被屏蔽），发现Google使用了URL重写，实际的请求地址是：

src=http://www.google-analytics.com/__utm.gif?utmwv=1&utmn=80790672&utmsr=-&utmsc=-&utmul=-&utmje=0&utmfl=-&utmdt=-&utmhn=webdataanalysis.net&utmr=&utmp=&utmac=UA-13232982-1&utmcc=__utma%3D82610576.209757388.1273508397.1273508397.1273586810.2%3B%2B__utmb%3D82610576%3B%2B__utmc%3D82610576%3B%2B__utmz%3D82610576.1273586810.2.2.utmccn%3D(direct)%7Cutmcsr%3D(direct)%7Cutmcmd%3D(none)%3B%2B__utmv%3D82610576.122.234.62.66%3B

　　后面带了一大堆的参数，不知道这里面有没有将session和Cookie的信息写进去，希望对这方面有所研究的朋友能够解答我的疑问。

网站实景访问调研

21 条回复

　　可能以前关注过我的博客的朋友已经发现，最近我的博客的界面发生了一些改变。其实我原本也没有过多的考虑过网站的界面和交互的问题，毕竟我对网站的交互设计不太了解，但一个偶然的机会，让我认识到也许我的博客需要做一些调整和优化了。

　　前几天有个朋友问我一些网站分析方面的问题，我引导他阅读我的博客，并且明确地告诉他我的博客的某篇文章中有他需要的内容，于是让我印象深刻的一幕发生了：

我的朋友打开了我的博客首页，首先他注意到了首页罗列了一些文章，于是他开始浏览首页文章的内容，但发现前几篇的文章概要显示这些都不是他要找寻的目标，于是他开始滚动鼠标开始下拉，可能有点失去耐心，越到下面鼠标拖动的速度越快，直到他只关注文章的标题（但某些内容不一定能直观地体现在标题上），于是结果可想而知，第一步以失败告终；

首页的文章中没有找到想要的内容，于是我的朋友开始将目光转向网站的顶部导航，但不幸的是当时顶部导航只有“首页”、“关于”和“网站地图”3项，他只是将鼠标移上去，却始终没有点击，至少他认为这三项中没有他需要寻找的线索。当时他就开始抱怨“到底在哪里呀？”为了不至于让“用户”流失，我提醒了一句“网站地图里面可能有。”但这时的他可能沉浸在自己的思路里面，也可能没注意，或者他不太理解“网站地图”的含义，还是一个劲自己去摸索……
于是，我的朋友开始注意到侧边栏，一般侧边栏也是用于全局导航和局部导航的。但看到侧边栏不是一排毫无主次之分的列表，就是一推看似混乱的标签云，失去耐心的他已经无法静下来去细看了，于是还是Failed。
最后的出路就是站内搜索，当然他最终通过站内搜索找到了他想到的内容，但却经历了一段坎坷的过程，试想如果我没有明确告诉他这里有他要的信息，对于普通用户来说他们真会有如此的耐心吗？

　　看到这些，我就意识到我的博客确实是应该做些改变了。从上面的测试过程中（我的朋友当了回临时的小白鼠，不好意思呀！）可以看到用户在我的博客中寻找信息的途径可能依次是：首页最新文章列表–>顶部导航栏–>侧边导航栏–>站内搜索（不知道你的网站用户是不是也是这样的），那么必须要对前几个途径做些调整和优化，以防止用户由于找不到想要的信息而流失，我是这样做的：

　　a. 既然用户只关注首页文章列表中的前几篇文章，也就是最新发表的几篇文章（这个可以从网站点击热图上也可以看出有这个趋势），用户不习惯于经常地去进行下拉操作。那为何不把以前值得推荐和分享的文章放到首页醒目的位置进行展示呢？

　　b. 根据用户的浏览习惯，用户偏向于使用网站的顶部导航，那么我就在顶部导航条上加些通俗易懂的标题：

　　c. 侧边栏的内容，也许我的博客主题默认的侧边栏视觉上千篇一律（其实个人感觉标签云的显示方式还是很漂亮的，但无论从网站的Overlay还是点击热图的点击统计情况看，标签云上的关键词无法吸引过多的点击，所以有时个人感觉良好的页面设计不一定能吸引用户，一定要从用户的角度去观察和分析），那么我就把分类目录的字体和颜色进行改变，让其更能引人注意：

　　上面我的博客中出现的问题，经过网站交互设计师的审视，他们可能可以用专业的眼光来解释问题所在，并用比我上面更加完美的处理方案来解决类似的问题，无论是优化交互流程、信息架构还是导航设计。但我是那方面的门外汉，所以在这里，我想用网站分析的角度来阐述下上面的问题，即网站定性分析方法中的网站实景访问调研（Site visits, also called follow-me-homes studies），下面就简单介绍一下：

　　网站实景访问调研，是指用户调研人员去网站用户的原始环境（用户的生活或办公环境，如家中或者办公室这类真实环境中），观察用户在网站中完成任务的情况。与网站可用性实验最大的不同在于，网站实景访问调研完全在真实的环境中进行，因此用户会受到外部环境的干扰，如访客、电话、临时状况等，但观察到的结果也能更加真实地反映用户与网站交互的流程。

　　还是参考Avinash Kaushik的《Web Analytics》一书中的内容，网站实景访问调研的操作步骤可以分3步进行：

1. 准备工作

　　与用户约个时间，告诉他们不需要对他们日常的环境作任何改变，只需要按平日一样浏览网站并回答几个问题即可；准备调研的资料和笔记，分配调研的任务，设定测试的任务、问题等。

2. 引导用户完成调研

分配给用户需要完成的任务，任务必须是明确的，并告诉他们只需要按照日常的方式访问网站；
仔细观察用户的一举一动，包括他们在遇到问题时的表情及情绪，尽量抓住用户的每个细节，这对后期的分析将会很有利，必要时可以采用视频的方式记录全过程；
尽量不要向用户提供任何提示，即使用户可能会遭遇到一些不小的麻烦；
可以在结束的时候向用户提几个问题，但过程以观察为主，遵循80/20原则，80%的时间用于观察，20%的时间来提问；
最后，在调研结束时不要忘记对用户说声“谢谢”。

3. 分析结果与优化

　　这时，你已经掌握了用户与网站交互的最真实的记录，当然要趁热打铁，马上讨论和分析这次调研的成果。用户在完成任务时遇到了哪些问题，他们又试图通过何种方式去解决这些问题。当然再找到问题之后最关键的还是优化和解决的方案。

　　网站实景访问调研，遵循了“用户为中心”的理念，对于了解用户的使用习惯，发现用户可能遇到的问题，及如何更好地满足用户的需求都具有十分重要的意义。但网站实景访问调研也十分的费时费力，同时无法获取过多的用户样本，所以对于反映问题的普遍性方面存在一定的不足。

　　如果你有足够的资源，你可以做些这方面的尝试，相信结果不会让你失望的。当然，上面我的朋友的案例只是一个举例的介绍，实际的操作过程需要严谨很多，我的博客在交互设计和用户体验上也许还存在着各种不够合理的地方，欢迎各位专业人士提出宝贵的改进建议。