网站的活跃用户与流失用户

wastage  网站用户管理的目标是发掘新用户,保留老用户。但仅仅吸引新用户还不错,还需要保持新用户的活跃度,使其能持久地为网站创造价值;而一旦用户的活跃度下降,很可能用户就会渐渐地远离网站,进而流失。所以基于此,我们可以对用户进行又一个细分——活跃用户和流失用户。

活跃用户与流失用户

  活跃用户,这里是相对于“流失用户”的一个概念,是指那些“存活”着的用户,用户会时不时地光顾下网站,同时为网站带来一些价值。同时,我们还需要知道到底有多少用户可能已经抛弃了我们的网站,不可能再为网站创造任何的价值,也就是所谓的流失用户。

  流失用户,是指那些曾经访问过网站或注册过的用户,但由于对网站渐渐失去兴趣后逐渐远离网站,进而彻底脱离网站的那批用户。当然,一个网站一定会存在流失用户,这是网站用户新老交替中不可避免的,但流失用户的比例和变化趋势能够说明网站保留用户的能力及发展趋势。

  举个简单的例子,我们经常可以看到某些数据分析报告中说:某某网站的注册用户数已经超过几百万,但其实这些数据并没有太大的意义,因为可能这几百万里面很多用户都已经不再登录该网站(流失用户),真正最近登录过或有过操作行为的用户(活跃用户)其实不到一万。所以对于一个网站而言,真正有意义的是活跃用户数而非总用户数,因为只有这些用户在为网站创造着价值。

  活跃用户用于衡量网站的运营现状,而流失用户则用于分析网站是否存在被淘汰的风险,以及网站是否有能力留住新用户。

活跃用户分析

  我的博客中之前的文章——用Engagement衡量用户活跃度中已经介绍了用户活跃度的衡量方法,并基于Engagement的定义计算网站的活跃访问量(Visits),同样可以用这类方法计算网站的活跃用户数(Unique Visitors)。同时可以计算不同时间区间的活跃用户数,比如每天、每周、每月……这里就不再详细介绍了,需要注意以下几个问题:

  1. 用户Engagement的定义,并以唯一用户为单位进行统计;
  2. 只要用户有任一一个Engagement的行为,就可以定义为活跃用户;
  3. 不要仅关注活跃用户数,试着分析活跃用户的变化趋势和所占比例。

流失用户分析

  流失用户的定义比较简单,就是一段时间内未访问或登录过网站的用户,一般流失用户都是对于那些需要注册、提供应用服务的网站而言的,比如微博、邮箱、电子商务类网站等。不同网站对于流失的定义可能各不相同,对于微博和邮箱这类用户几乎每天登录查看的网站而言,可能用户未登录超过1个月,我们就可以认为用户可能已经流失了;而对于电子商务而言,可能3个月未登录或者半年内没有任何购买行为的用户可以被认定是流失用户。下面的分析主要是基于网站的注册用户的,因为这类用户更容易识别,而且分析这类用户的流失情况对网站而言更有意义。

数据的获取

  流失用户是通过用户的最近一次登录距离当前的时间来鉴定的,所以要分析流失用户,需要知道每个用户的最后一次登录时间,而对于不同网站而言,这个时间间隔会各不相同,最长可能会有1年或者更久,所以在数据获取方面会有一定的难度。如果分析的是注册用户,那么一般网站都会在数据库中建相应的表来存放用户信息,所以建议在储存用户基础信息的同时记录用户的最近一次登录时间,这样就能够准确地计算用户最近一次登录距离当前的间隔时间,进而区分该用户是否流失。

流失用户变化趋势

  首先需要明确的是用户的流失可能并不是永久的,也许用户在一段时间内对网站确实没有任何需求,那么他会远离网站一段比较长的时间;或者流失用户也会因为网站的某次营销或者网站质量的改善而重新回来。网站总的流失用户数的计算比较简单,以超过1个月内登录即为流失为例,那么总流失用户数就是所有“当前时间点-用户最近一次时间点>1个月”的用户数量。但是单纯的总流失用户数量对于分析是没有意义的,因为大部分情况下这个数值是一直递增的,我们需要计算总流失用户数占总用户数的比例及新增流失用户数,观察它们的变化趋势,如下表:

日期 总用户数 流失用户数 新增流失用户数 用户流失率
2010年8月1日 325694 228451   70.14%
2010年8月2日 326127 228925 474 70.20%
2010年8月3日 326789 229507 582 70.23%
2010年8月4日 326297 230023 516 70.49%
2010年8月5日 326913 230618 595 70.54%
2010年8月6日 327514 231209 591 70.60%
2010年8月7日 328163 231672 463 70.60%
2010年8月8日 328517 232216 544 70.69%
…… …… …… …… ……

新用户流失率

  也许你的网站已经吸引了一批新的访客,并且他们成功注册成为了网站的用户,你有了一个好的开始,已经成功了一半,那么另一半呢?就是如何保留住这些新的用户,让他们持续地为网站带来价值,这就是分析新用户流失率的意义。

  我们可认为新用户注册后就完成首次登陆,那么简单地定义新用户流失,就是用户在注册后一段时间内都没有登录过网站,即

当前时间点 – 用户注册时间点 > 流失临界时间间隔

  比如我们定义用户的流失临界时间间隔为1个月,也就是在注册后的一个月内未登录的用户意味着已经流失,那么就可以计算每天的新用户流失数,即注册时间为1个月前的那一天,而从注册到当前没有登录过的用户数。这个用户数与1个月前的那一天的总注册用户数的比例就是新用户的流失率

当天的新用户流失数 / 当天的总注册用户数 = 新用户流失率

  计算出每天的新用户流失率,并观察它的变化趋势:

new-user-wastage-rate

  网站能否保留住新用户就在于是否能够不断地降低新用户的流失率。

  总结,这里主要介绍的是如何分析网站真正拥有的有价值的活跃用户的数量以及网站保留这些用户的能力,可以用流失用户的变化趋势来衡量网站用户的总体流失情况,用新用户流失率衡量网站保留住新用户的能力,而分析活跃用户数的比例和变化趋势分析能够衡量网站现有用户的质量和价值。

数据仓库的基本架构

  数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision Support)。其实数据仓库本身并不“生产”任何数据,同时自身也不需要“消费”任何的数据,数据来源于外部,并且开放给外部应用,这也是为什么叫“仓库”,而不叫“工厂”的原因。因此数据仓库的基本架构主要包含的是数据流入流出的过程,可以分为三层——源数据数据仓库数据应用

data-warehouse-frame

  从图中可以看出数据仓库的数据来源于不同的源数据,并提供多样的数据应用,数据自上而下流入数据仓库后向上层开放应用,而数据仓库只是中间集成化数据管理的一个平台。

  数据仓库从各数据源获取数据及在数据仓库内的数据转换和流动都可以认为是ETL(抽取Extra, 转化Transfer, 装载Load)的过程,ETL是数据仓库的流水线,也可以认为是数据仓库的血液,它维系着数据仓库中数据的新陈代谢,而数据仓库日常的管理和维护工作的大部分精力就是保持ETL的正常和稳定。

  下面主要简单介绍下数据仓库架构中的各个模块,当然这里所介绍的数据仓库主要是指网站数据仓库。

数据仓库的数据来源

  其实之前的一篇文章已经介绍过数据仓库各种源数据的类型——数据仓库的源数据类型,所以这里不再详细介绍。

  对于网站数据仓库而言,点击流日志是一块主要的数据来源,它是网站分析的基础数据;当然网站的数据库数据也并不可少,其记录这网站运营的数据及各种用户操作的结果,对于分析网站Outcome这类数据更加精准;其他是网站内外部可能产生的文档及其它各类对于公司决策有用的数据。

数据仓库的数据存储dw-data-storage

  源数据通过ETL的日常任务调度导出,并经过转换后以特性的形式存入数据仓库。其实这个过程一直有很大的争议,就是到底数据仓库需不需要储存细节数据,一方的观点是数据仓库面向分析,所以只要存储特定需求的多维分析模型;另一方的观点是数据仓库先要建立和维护细节数据,再根据需求聚合和处理细节数据生成特定的分析模型。我比较偏向后面一个观点:数据仓库并不需要储存所有的原始数据,但数据仓库需要储存细节数据,并且导入的数据必须经过整理和转换使其面向主题。简单地解释下:

  (1).为什么不需要所有原始数据?数据仓库面向分析处理,但是某些源数据对于分析而言没有价值或者其可能产生的价值远低于储存这些数据所需要的数据仓库的实现和性能上的成本。比如我们知道用户的省份、城市足够,至于用户究竟住哪里可能只是物流商关心的事,或者用户在博客的评论内容可能只是文本挖掘会有需要,但将这些冗长的评论文本存在数据仓库就得不偿失;

  (2).为什么要存细节数据?细节数据是必需的,数据仓库的分析需求会时刻变化,而有了细节数据就可以做到以不变应万变,但如果我们只存储根据某些需求搭建起来的数据模型,那么显然对于频繁变动的需求会手足无措;

  (3).为什么要面向主题?面向主题是数据仓库的第一特性,主要是指合理地组织数据以方面实现分析。对于源数据而言,其数据组织形式是多样的,像点击流的数据格式是未经优化的,前台数据库的数据是基于OLTP操作组织优化的,这些可能都不适合分析,而整理成面向主题的组织形式才是真正地利于分析的,比如将点击流日志整理成页面(Page)、访问(Visit或Session)、用户(Visitor)三个主题,这样可以明显提升分析的效率。

  数据仓库基于维护细节数据的基础上在对数据进行处理,使其真正地能够应用于分析。主要包括三个方面:

数据的聚合

  这里的聚合数据指的是基于特定需求的简单聚合(基于多维数据的聚合体现在多维数据模型中),简单聚合可以是网站的总Pageviews、Visits、Unique Visitors等汇总数据,也可以是Avg. time on page、Avg. time on site等平均数据,这些数据可以直接地展示于报表上。

多维数据模型

  多维数据模型提供了多角度多层次的分析应用,比如基于时间维、地域维等构建的销售星形模型、雪花模型,可以实现在各时间维度和地域维度的交叉查询,以及基于时间维和地域维的细分。所以多维数据模型的应用一般都是基于联机分析处理(Online Analytical Process, OLAP)的,而面向特定需求群体的数据集市也会基于多维数据模型进行构建。

业务模型

  这里的业务模型指的是基于某些数据分析和决策支持而建立起来的数据模型,比如我之前介绍过的用户评价模型、关联推荐模型、RFM分析模型等,或者是决策支持的线性规划模型、库存模型等;同时,数据挖掘中前期数据的处理也可以在这里完成。

数据仓库的数据应用dw-data-application

  之前的一篇文章——数据仓库的价值中介绍过数据仓库的四大特性上的价值体现,但数据仓库的价值远不止这样,而且其价值真正的体现是在数据仓库的数据应用上。图中罗列的几种应用并未包含所有,其实一切基于数据相关的扩展性应用都可以基于数据仓库来实现。

报表展示

  报表几乎是每个数据仓库的必不可少的一类数据应用,将聚合数据和多维分析数据展示到报表,提供了最为简单和直观的数据。

即席查询

  理论上数据仓库的所有数据(包括细节数据、聚合数据、多维数据和分析数据)都应该开放即席查询,即席查询提供了足够灵活的数据获取方式,用户可以根据自己的需要查询获取数据,并提供导出到Excel等外部文件的功能。

数据分析

  数据分析大部分可以基于构建的业务模型展开,当然也可以使用聚合的数据进行趋势分析、比较分析、相关分析等,而多维数据模型提供了多维分析的数据基础;同时从细节数据中获取一些样本数据进行特定的分析也是较为常见的一种途径。

数据挖掘

  数据挖掘用一些高级的算法可以让数据展现出各种令人惊讶的结果。数据挖掘可以基于数据仓库中已经构建起来的业务模型展开,但大多数时候数据挖掘会直接从细节数据上入手,而数据仓库为挖掘工具诸如SAS、SPSS等提供数据接口。

元数据管理

  元数据(Meta Date),其实应该叫做解释性数据,即数据的数据。主要记录数据仓库中模型的定义、各层级间的映射关系、监控数据仓库的数据状态及ETL的任务运行状态。一般会通过元数据资料库(Metadata Repository)来统一地存储和管理元数据,其主要目的是使数据仓库的设计、部署、操作和管理能达成协同和一致。

  最后做个Ending,数据仓库本身既不生产数据也不消费数据,只是作为一个中间平台集成化地存储数据;数据仓库实现的难度在于整体架构的构建及ETL的设计,这也是日常管理维护中的重头;而数据仓库的真正价值体现在于基于其的数据应用上,如果没有有效的数据应用也就失去了构建数据仓库的意义。

网站新老用户分析

New-Returning-Visitors  网站中新老用户的分析已经成为了网站分析中常见的一类用户细分的方法,也是网站分析中用户分析的一个重要组成。Google Analytics中对新老用户的命名分别为New Visitors和Returning Visitors,同时也为许多的分析指标提供了基于新老用户的细分。

  简单地说,新用户就是首次访问网站或者首次使用网站服务的用户;而老用户则是之前访问过网站或者使用过网站服务的用户。无论是新老用户都能为网站带来价值,这也是分析的意义所在。

分析新老用户的意义

  网站的老用户一般都是网站的忠诚用户,有相对较高的粘度,也是为网站带来价值的主要用户群体;而新用户则意味着网站业务的发展,是网站价值不断提升的前提。可以说,老用户是网站生存的基础,新用户是网站发展的动力,所以网站的发展战略往往是在基于保留老用户的基础上不断地提升新用户数。

  所以分析新老用户的意义就在于:通过分析老用户,来确定网站的基础是否稳固,是否存在被淘汰的危机;通过分析新用户,来衡量网站的发展是否顺利,是否有更大的扩展空间。一个着眼现在,一个放眼未来。

新老用户的辨别

  对于网站用户的识别,之前写过一篇相关的文章——网站用户的识别,里面主要是在基于点击流日志的基础上提供的4类识别用户的方法,可以作为参考。但对于新老用户的辨别可能根据网站自身的特定而有不同的定义方法。

  最常见的一种辨别新老用户的方式就是看该用户之前是否访问过网站,也就是以用户是否首次访问来区分,GA就是使用Cookie来定义新老用户的,即该Cookie之前出现过则该访客为老用户,否则为新用户。这个定义适用于所有网站,但有它不准确的地方,Cookie的删除、用户更换PC等都会造成数据上的偏差。

  另一种辨别方式相对准确,但一般只适用于注册登录型网站,即定义首次注册登录的用户为新用户,再次登录的用户为老用户,而不是使用首次访问来辨别。这种区分方式一般以用户ID或用户名来辨别,相对准确,但应用的范围有限。

新老用户分析

  网站的目标在于保持老用户,拓展新用户,那么对于网站数据分析上的表现,则是在保持老用户数量的稳定增长的前提下,提升新用户的所占比例

  对于大部分发展正常的网站而言,网站的老用户数应该是保持相对稳定的,并且会有持续的小幅上涨,可以看一下GA上我的博客每周老用户数的趋势变化:

returning-visitors-trend

  可以通过GA的Dashboard上的Advanced Segments选择Returning Visitors,并选择合适的时间区间和汇总粒度(日、周、月)显示趋势变化曲线。这条平滑的上升曲线说明网站的发展是趋于正常的。

  但并不是所有网站的老用户趋势都会如此的平滑,比如旅游网站,旅游业会明显地受到季节的影响呈现比较大的波动,所以这里要引入同比环比的概念进行分析。

同比指的是为了消除季节变动的影响,将本期的数据与去年同期的数据进行比较,比如今年2月的数据与去年2月数据的比较;

环比指的是将本期的数据与前期的数据进行比较,可以是日环比、月环比、周环比等,例如今年2月与今年1月的数据比较。

  同比和环比被大量地应用于基于时间序列的趋势分析中,对于网站而言,访问量、销售额、利润等网站关键指标同样可以引用同比和环比进行分析,对于分析这些指标的变化趋势,消除季节的影响等都是有积极的效果。下面是一张基于同比和环比的旅游类网站老用户数据模拟趋势分析图:

returning-visitors-tb-hb

  从图上可以看出由于季节的影响,老用户数的波动比较大,所以相应的环比增长的波动也很大,但同比增长的趋势却相对平滑,一直保持在10%左右的增长率上面,这就可以看出网站对保持老用户是有效的,网站的运营状况较为稳定。

  可能有人会问,为什么要用绝对数量,而不是用相对数量,比如老用户占总访问用户的比例来进行趋势分析?这里主要考虑到网站会不定期的进行主动地推广营销,或者由于某些事件或媒体传播的影响而产生的被动推广的效果,这个时候可能会吸引大量的新用户进入网站而导致老用户比例的急剧下滑,而老用户的绝对数据对于网站而言相对稳定,更具参考价值。

  新用户的绝对数量并没有老用户这么稳定,也不一定会保持增长的态势,而对于新用户的分析主要是为了衡量网站推广的效果,评估上述主动营销或被动事件带来的影响,所以不建议使用绝对数值,既然老用户相对稳定,那么就可以基于新用户比例的变化趋势来分析网站某段时间的推广效果。GA的Benchmarking中提供的也是New Visits所占比例与其他网站基准线的趋势比较:

new-visits-trend

  往往曲线中某个时间点的大幅上升或下降都意味着某个营销事件的影响,而当曲线持续下降时就意味着网站推广效果的不利,需要增大推广的力度。

  如果你有关于网站新老用户分析更好的见解,欢迎评论。

数据仓库的源数据类型

dw-source-data  数据仓库中集成了企业几乎所有的可以获取到的数据以用于数据分析和决策支持,当然也包括了我在网站分析的数据来源一文中所提到的所有数据。这些进入到数据仓库中的数据无外乎三种类型:结构化数据半结构化数据非结构化数据,它们经过转化后以某种形式统一地储存在数据仓库中,即通常说的ETL(Extract, Transform, Load,抽取、转换、装载)的过程。下面主要说一下这三种数据类型的区别,它们分别包括哪些源数据以及这些数据在网站数据分析中的作用。

结构化数据

  这类数据的格式非常规范,典型的代表就是关系数据库中的数据,这些数据可以用二维表来存储,有固定的字段数,每个字段有固定的数据类型(数字、字符、日期等),并且每个字段的字节长度也相对固定。这类数据也是最易管理维护的,同时对于查询、展示和分析而言也是最为方便的一类数据格式。

  结构化的数据在网站中一般指的是网站内部的数据库数据以及一些外部开放的数据库接口中获取的数据。这些数据可以直接通过ETL导入到数据仓库中进行集成化管理,而在网站分析和数据分析中直接可以根据需要通过SQL语句查询导出。

  结构化的数据在网站数据分析中占据着举足轻重的地位,这些存储在数据库中的数据一般都是网站的运营数据及用户操作的结果数据(Outcome),比如网站的注册用户数、博客的文章数、评论数……而对于电子商务类网站而言,那些订单和销售数据也直接的存储与数据库中,而基于这些数据计算得到的总利润、每个订单平均利润、每个用户创造利润等KPI数据可以直接分析网站的目标是否实现。

半结构化数据

  半结构化数据的格式较为规范,一般都是纯文本数据,可以通过某种方式解析得到每项的数据。最常见的就是日志数据、XML、JSON等格式的数据,它们每条记录可能会有预定义的规范,但是可能每条记录包含的信息不尽相同,也可能会有不同的字段数,包含不同的字段名或字段类型,或者包含着嵌套的格式。这类数据一般都是以纯文本的形式输出,管理维护也较为方便,但在需要使用这些数据时,如获取、查询或分析数据时,可能需要先对这些数据格式进行相应的解析。

  半结构化的数据通常是指网站的日志数据,或者因为某些需求以XML或JSON格式输出的数据。最常见的就是网站的Apache日志,它根据预定义的字段顺序打出相应的值:

72.14.192.1 – - [09/May/2010:03:35:02 +0800] “GET / HTTP/1.1″ 200 13726 “-” “Mozilla/5.0 (Macintosh; U; PPC Mac OS X; en-US),gzip(gfe) (via translate.google.com)”

而JSON格式则会以键值对(Key/Value)的形式输出数据:

{time: 1234567890, action: “comment”, respond: true, user: {userid: 1, username: “abc”}}

  对于像Apache日志那样的数据,我们可以根据需要切分出那些有用的数据将它们导入到数据仓库,而xml和JSON格式的数据我们可以调用各类字符串解析的方法通过它们的标签或者名称来获取相应的值,对于嵌套结构可以使用逐层遍历的方法依次获取,同样选取那些对于分析有用的数据存在数据仓库。在这个过程中,ETL中的转换部分会显得较为复杂,因为这里需要进行格式解析,而这一步的优劣直接影响ETL的稳定性和健壮性。还有一个令人头疼的问题就是数据的格式和存放问题,也许有必要创建一些自定义字段类型;或者选择NOSQL数据库,关于NOSQL数据库的讨论一度热火朝天,从Google的Big table、Amazon的Dynamo到Facebook的Cassandra,NOSQL数据库提供了可扩展性的海量数据存储,对于WEB数据管理提供了新的解决方案。

  半结构化数据对于网站数据分析同样非常重要,网站的点击流日志及一些用户行为数据一般都是以半结构化数据的形式输出的,当我们需要统计网站分析中的各类指标或者进行用户行为分析时,这类数据就必不可少。

非结构化数据

  非结构化数据指的是那些非纯文本类数据,没有标准格式,无法直接地解析出相应的值。常见的非结构化数据有富文本文档、网页、多媒体(图像、声音、视频等)。这类数据不易收集管理,也无法直接查询和分析,所以对这类数据需要使用一些不同的处理方式。

  富文本、图片、声音、视频等这些信息,除非需要进行高级的文本挖掘或者多媒体数据挖掘,否者对于一些日常涉及的数据统计和分析而言,非结构化数据本身是没有分析的价值的。所以一般不会将非结构化数据直接以二进制的形式存入数据仓库,数据仓库之父——Inmon的建议是在数据仓库中只需要储存非结构化数据的元数据(Meta Data),或者称为解释型数据。所以我们一般将非结构化的数据存放在文件系统(File System)中,而在数据仓库里面记录这些数据的信息,以便快速地索引和寻找需要的数据。如Word文档的标题、摘要、作者、创建时间、最近一次修改时间等,而图片则可能还包括像素、分辨率等。就像你右击文件属性的详细信息标签下看到的那些数据项,这些非结构化数据的元数据能够通过标准的形式记录,并且能帮助快速地搜索查询到对应的非结构化数据,同样可以被用于统计和分析,其实就是给每个非结构化数据贴上了标签,并将标签信息记录到了数据仓库中。

  可能对于大多数网站而言,这类非结构化数据除非被用于高级的数据挖掘,在大部分时间中它们对数据的统计分析作用并不大,但对于某些网站,比如图片、视频类网站,这些数据就至关重要。对于图片、视频网站而言,每个图片和视频就是网站的产品,而记录图片视频的元数据就是这些产品的详细信息数据,产品分析、产品细分等都依赖于这些数据;同样,对于一些公司的内部归档的文档、资料而言,如果有数据仓库统一地记录这些文件的信息,就能够在必要时快速地搜索找到需要的文件,对于信息的统一集成化管理非常有效。

  随着互联网的不断发展,各类信息不断膨胀,还有各式各样的数据类型会不断涌现,而数据仓库扮演着数据集成者的角色,对于各类数据的处理和管理也将不断地改进优化。

提升用户满意度

——让用户更容易地找到需要的信息5

customer-satisfaction  在前一篇文章——用户任务完成度分析中我似乎遗漏了一个重要的问题:为什么要分析用户的任务完成度?其实每个网站分析的方案和模型都应该具备它的目的和意义,否者就失去了分析的价值。所以这篇文章就是为了回答这个问题,同时也作为“让用户更容易地找到需要的信息”专题的完结篇。

  所以这里先提出一个假设:让用户更容易地找到需要的信息进而帮助用户完成预期的任务,能够有效地提升用户满意度。

用户满意度的影响因素

  我们不妨先来看一下用户满意度是怎么定义的,根据美国顾客满意度指数模型(ACSI, American Customer Satisfaction Index)的描述,用户满意度是用户对产品或服务的预期与实际接受的产品或服务的感受间的差距,差距越小,满意度越高。对于以信息服务为主的网站而言,用户访问网站的预期就是找到自己需要的信息,完成既定的任务(寻找信息、购物、娱乐等),那么如何衡量用户实际接受到的网站服务的质量水平,进而推测它们之间存在的差距?对于用户对网站实际的感受,可以从以下3方面体现:

  1. 用户是否完成预期任务(网站是否及格)
  2. 完成任务过程中良好的体验(也许网站能打八九十分了)
  3. 感受创意或意外的收获(获得附加分的机会)

  所以,保证用户完成预期的任务是网站质量的及格线,也可以看作是网站的生命线。那么任务完成度对于用户满意度是否有这么重要的影响呢?我们需要对以上的假设进行验证。

任务完成度与用户满意度

  为了验证任务完成度是否对用户的满意度有显著的影响,我们在统计用户任务完成情况的同时,需要收集用户对网站的满意度,所以上篇文章问卷调查中对用户满意度的打分题中采集到的数据就有了用武之地。我们可以通过比较完成任务的用户与未完成任务的用户对满意度的打分是否存在显著性差异的方法来验证任务完成度对用户满意度的影响是否显著。

  这里可以使用两组独立样本T检验的方法,把问卷调查中采集到的样本数据分为两组,一组是未完成任务的用户的满意度打分,另一组是完成任务用户的满意度打分,我们可以认为这两组数据都是近似的符合正态分布,进而比较这两组样本的总体均值是否存在显著差异。(或许你认为这个结果是显而易见的,这个验证完全是多此一举,那就当我是画蛇添足,无聊打发时间吧。 ;)

  首先提出零假设:

H0 : μ1 = μ2

  再将收集到的样本数据通过SPSS或Excel的数据分析功能进行双样本均值T检验,过程就不详细论述了,不然估计很多用户立马会离开网站甚至直接关闭浏览器了。

cs-T-test

  从SPSS的分析结果中可以看出,完成任务与未完成任务用户的满意度打分均值(上面一张表Mean值)可以看出,完成用户的满意度均值明显大于未完成用户。从下面那张表的95%置信区间的检验结果可以看到,F检验的显著性概率为0.847>0.05,所以我们可以认为完成任务用户与未完成任务用户的满意度打分的样本方差没有明显差异;而T检验的显著性(双尾)概率近似于0,小于0.05,因此拒绝零假设,即两个样本的总体均值存在显著差异,进而我们可以得出完成任务的用户满意度显著地高于未完成任务的用户满意度。

  通过上面的分析,我们验证了文章一开始提出的假设,即用户的任务完成度对提升用户的整体满意度有显著的影响。那么如何通过提高用户的任务完成度来提升用户满意度呢?

如何提升用户满意度

  提升用户满意度,我们可能需要做很多事情,从全局到细节,需要处处为用户的体验和感受着想。既然我们已经验证用户的任务完成度对用户满意度会产生显著影响,那么我们可以先从提升用户的任务完成度开始。这里可以参考我之前写的关于如何让用户更容易地找到需要的信息的4篇文章——优化网站信息架构优化网站内部搜索优化网站导航设计优化相关内容推荐

  这些优化可以从普遍的层面上提高用户的任务完成度,但显然以上这些还是不够的,因为用户的知识构成存在着差异,用户遇到的问题也会各不相同,所以上篇文章的问卷中当用户未完成任务时填写的为什么没有完成任务的开放性问题就能发挥作用了,我们需要针对各类用户(甚至个别用户)遇到的不同问题分别提供有效的解决方案,这也是为什么很多网站都会设置FAQ甚至在线客服的原因。

  所以我们首先要满足用户访问网站的最基本的期望——完成他们预期的任务,从该层面上提升用户满意度,下面是我画的一个简单的示意图,就作为文章的结尾吧:

task-completion-customer-satisfaction

用户任务完成度分析

wow_tasks  欢迎来到艾泽拉斯大陆……如果你玩过魔兽世界,也许你在里面完成过无数个任务;当用户在访问网站时,其实他们也在试图完成某些特定的任务。

  也许大家都比较熟悉网站目标(Goal),因为很多网站分析工具都提供了基于目标的分析,网站目标更多地是从网站的角度去定义的,比如电子商务网站的目标就是促成有效的交易;而用户任务(Task)则是从用户的角度去定义的,用户会有自己的目标,比如用户上电子商务网站可能只是为了查询某些商品的信息,询价,或者只是单纯的逛逛。所以每个用户带着自己的任务访问网站,这些任务可能各不相同,这无疑给分析带来了一定的难度。

关于任务完成度的定义

  其实跟前面一篇文章——用Engagement衡量用户活跃度中的Engagement度量类似,用户任务也是一个非标准度量,而且根据网站的不同和用户访问目的的不同而显得千差万别。但用户任务完成度(Task Completion)与Engagement也存在着差异,Engagement定义的是用户的行为或动作,只要发生我们就认为用户参与了;而任务完成度定义的是结果,只有当用户的某个需求被实现时(如购买成功、获取到了相关信息、通过网站解决了某个问题……)才能认为用户完成了任务。

  用户的Engagement不会直接影响网站目标,那么用户的任务完成度是否会对网站目标有直接影响呢?如果说网站目标(Goals)是从网站的角度衡量网站的商业目的(Business Objectives)是否实现的话,那么任务完成度(Task Completion)则是从用户的角度衡量用户的期望(User Expectation)是否达到。所以只有当网站目标与用户的任务一致时,我们才能认为用户任务完成度会对网站目标产生直接影响,因为两者衡量的都是结果,所以这种直接的影响有些时候甚至是可以划等号的。

  既然用户访问网站的目的各不相同,每个人都带着各自的任务,那么我们如何获悉用户访问网站到底是来做什么的呢?

如何获取用户的任务信息

  用户任务是一个非标准度量,并且是由用户自己决定的,我们似乎无法从点击流日志的用户行为分析中辨认用户到底是以什么样目的访问网站,我们需要直接向用户寻求答案。

  前几天在Justin Cutroni的博客Analytics Talk看到了一个有意思的在线问卷调查,其实就是简单的2-3个问题,关于你为何来到这个网站,你完成了预期的任务吗,以及你对这次网站浏览的满意度如何,最后再加上一个可以自由填写的反馈,Justin Cutroni使用的是http://www.4qsurvey.com/这个网站提供的在线问卷服务,好像蓝鲸的博客也提供了在线问卷,他使用的是http://polldaddy.com/,还有一个提供反馈的功能http://www.kampyle.com/。其实这些都是收集用户信息的好办法,通过调查问卷(Survey)的方式让用户来告诉你答案。

  如果我们需要分析用户的任务完成度,可以设计一个简单的在线问卷,提供在线问卷调查的网站很多,国内的国外的、免费的收费的,其实操作都比较简单,但首先我们需要注意一下几个问题:

  1. 什么时候向用户提供调查问卷?如果是分析任务完成情况,那么很明显要在用户离开网站的时候;
  2. 以何种方式提供问卷?比较常见的是弹出窗口或跳转链接,但无论用什么方式建议都先礼貌地问下用户是否愿意填写问卷;
  3. 在用户完成问卷时不要忘记感谢用户的支持,或者让用户留下邮箱以告知他们调查分析的结果,这些都是他们应得的,当然也可以借机推广你的网站;
  4. 问卷的设计,这是个复杂的问题,完全可以写本书了,这里只是提供用户任务完成分析的问卷设计,我的建议是如果不是一次全面系统的网站分析问卷调查,那么尽量减少问卷中的问题数量,而且尽量要一开始就告诉用户问卷的长度及可能占用他们多少时间。其实如果只是分析用户任务完成度,3个问题就足够了:

task-completion-survey

分析用户的任务完成度

  基于从问卷调查中获得的数据,我们可以借用一些图表来分析用户的任务完成情况。

  首先,必须明确用户任务也是基于用户在网站上的一次访问(Visit)。一般用户一次访问只是为了完成一个任务,所以对于大部分网站而言,更偏向于衡量一次访问的任务是否完成而不是完成的百分比。所以这里的任务完成度(Task Completion) 的定义并不是每次访问用户完成任务的程度,而是所有的用户访问中完成任务的访问占所有访问的比重,即

任务完成度 = 完成任务的访问数 / 总访问数

  可以基于任务类型进行细分,以电子商务网站为例,假如问卷中的任务选项包括:

  • 购买商品
  • 查询商品信息
  • 售前售后咨询
  • 其它

  根据问卷采集的数据可以得到下图:

task-completion-segment

  基于任务类型的细分,可以分析每类任务的用户访问量所占比例(左侧饼图),以及每类任务的完成情况(右侧柱状图,总高度为每类任务的总访问量,,蓝色区块的高度为完成任务的访问数,可以看出每个任务类型中完成的访问数所占比重)。如果网站中进行的是长期的问卷调查,同样可以对每类任务的完成度进行趋势分析,如下图:

task-completion-trend

  趋势分析可以有效地掌握用户在网站中完成任务的变化情况,进而衡量网站在运营优化上面取得的成果。

  接下来该由你来做些什么了,你可以尝试用你的方法寻找更恰当的图表来展示和分析数据。

优化相关内容推荐

——让用户更容易地找到需要的信息4

  博客之前的一篇文章——优化网站导航设计,介绍了如何评价网站导航功能及基于分析的优化。但后来才发现其中遗漏了Google Analytics上一个很实用的功能——Navigation Summary,字面上翻译是“导航概要”,但似乎用“页面上下游”(百度统计上的称呼,拿过来先借用下)分析更加贴切。它能够很好地分析网站导航的实现度(说得直观点就是导航功能上的有效点击或操作),下面就来介绍下这个功能。

更好地衡量导航实现度

  先看一下我的“文章专题推荐”这个导航索引页面的在GA的Navigation Summary报表(该功能在Content模块的Top Content标签下面):

featured-topics-navigation-summary

  从上图可以看到页面被浏览的次数(图中标注1),有多少的比例的Visits是从站外进入这个页面开始访问网站的(图中标注2),有多少的比例的Visits是从网站内部的页面跳转到这个页面的(图中标注3),有多少的比例的Visits在浏览的该页面后离开了网站(图中标注4),有多少比例的Visits从该页面进入了网站的其他页面(图中标注5,4和5部分现在貌似数据有点问题);同时列出了网站内部前10名的上游页面(浏览该页面之前用户所在的那个页面,图中标注6)和下游页面(浏览该页面后紧接着浏览的下一个页面,图中标注7),及它们各自所占的百分比。这里需要注意的是有时会在上游页面和下游页面出现与选择页面相同的URI地址,比如你选择首页(/)进行分析,上游页面和下游页面也出现了首页地址(/),这个主要是刷新操作引起的,GA会把页面刷新统计到Pageviews里面。

  通过上面这个功能,我们就不再需要通过导航页面的离开率(Exit Rate)来粗略估计有多少的Visits留在了网站并可能点击了导航页面的链接。并且通过Navigation Summary我们不仅可以看到有多少Visits从导航页直接离开了,而且可以通过分析导航页的下游页面更加准确地衡量有效点击率,排除那些刷新、返回或者调到其他非导航列表页的操作,将那些导航页面中的链接的点击率(%Clicks)相加,就是该导航页面的有效点击转化(CTR),也就是该导航功能的实现度指标了。以上表为例,排除返回首页(/)、页面刷新(/featured-topics/)及跳转到非导航页面中的页面(/about/、/site-map/等)这些点击,将剩下的实现了导航功能的有效点击率相加就是该导航功能的实现度,可惜GA上的上下游页面都只能显示前10个。

  上面是对前一篇关于优化导航设计的内容的补充,其实页面的上下游分析是一种很有效的网站分析方法,不仅可以用于分析导航实现度,下面介绍一下它的另外一种应用——相关内容推荐效果分析。

网站的相关内容推荐

related-content  博客之前的一篇文章——优化网站信息架构中介绍了大部分的网站可能都是基于树形结构来进行购建的,但是原始的树形结构本身存在一个问题就是叶子节点(或者说是网站的内容节点)之间没有直接的联系,也就是用户无法从一个底层的内容页直接跳转到另外一个底层内容页,需要返回首页或者中间导航索引页面才能进入其他的内容页面,从那篇文章的树形架构图中也有体现,底层页面之间没有直接相连的线条。所以很多网站都会在内容的结尾或侧边栏提供相关内容的推荐,比如亚马逊、淘宝等电子商务网站产品页面会有同类别、同价位的产品推荐,或者是用户在购买该产品的同时也购买了的产品推荐,豆瓣上的书籍、音乐、电影页面也提供了相关内容的推荐。

  这些功能很多都是基于内容相关度的算法来实现的,之前的文章——向上营销、交叉营销与关联推荐介绍过基于用户行为的关联推荐方法。其实很多博客也有类似的功能,即每个文章结尾的相关文章,下图是我的博客的电子商务网站RFM分析这篇文章的相关文章列表:

rfm-related-posts

  我是用Wordpress的插件——Yet Another Related Posts Plugin来实现这个功能的,按照插件的介绍,它是通过计算文章的标题、正文、标签和分类的相关度选取排名前几的显示到页面上。这个功能很棒,它打通了文章页面之间的通道,也许用户在看完一篇文章之后还想浏览下相关的文章,那么相关内容推荐就提供了很好的途径,用户不需要再回退到内容的检索页面,直接点击就行,帮助用户更加方便、快速地定位到想要寻找的信息上。

相关内容推荐效果分析

  网站中的相关内容推荐功能很多都是借助机器算法来自动生成的,所以从某种层度上来说,算法一定会存在优劣,我们需要通过分析来评估功能的实现效果,从而不断地对算法进行优化。而基于用户浏览行为的分析是评估功能实现效果的最有效的方法,所以网站分析又有了用武之地了,上面介绍的Google Analytics上的Navigation Summary就是非常适合用来分析相关内容推荐效果的工具。这里还是以电子商务网站RFM分析这篇文章的上下游页面分析为例看看我使用的这个插件的效果到底怎样:

rfm-navigation-summary

  从上下游页面的列表中查看那些来源于内容页面和去往其他内容页的比例,其中哪些页面的流入和流出的比例最高,然后再与网站相关内容推荐列表中的排名进行比较,这样就能反应网站功能的相关性与用户眼中的相关性是否一致,从而检验功能的实现效果。

  如果进行算法调整,那么同样可以用该方法检验算法调整前后的上下游页面转化比例,从而衡量在算法调整后相关内容推荐功能是否真正得到了优化。而我们要做的就是通过不断优化相关内容推荐的算法使网站内容的相关度排名与用户对内容的预期相关性尽量达成一致,这样才会使页面上显示的相关内容就是用户想要寻找的内容,从而满足用户的需求。

  这里需要注意几个问题:

  1. 也许一个内容页面里面会有不止一处的相关推荐模块,或者会有多处出现其他内容页的链接,在GA的报表上提供的是所有流入流出的总和,所以如果只是评测某一推荐模块的效果,需要区分该模块中的链接,也许加URL参数会是一个解决方案。
  2. 注意数据的时间区间与网站内容的变化带来的相关内容推荐的变化。Google Analytics上默认的时间区间是前一个月,你可以选择合适的区间来进行分析和比较,注意网站内容的更新对相关内容推荐带来的影响。
  3. 有些相关内容间的推荐并不是双向的,比如在购买MP3的页面推荐耳塞,而在购买耳塞的页面可能并不会去推荐MP3,所以有时有必要对上游页面和下游页面分开分析,注意转化的方向性。

  上面就是我想到的Google Analytics的Navigation Summary功能的两个应用实例,你是不是还想到了更多的应用,欢迎分享你的观点。

用Engagement衡量用户活跃度

engagement  Engagement(参与度)是一个特殊的度量,Avinash认为Engagement不应该作为网站分析的一个度量,它更像是不愿意去寻求衡量网站是否成功的真正指标时使用的一个借口。他列举了Engagement存在的几个缺陷:  

  •  Engagement对于不同网站而言是不同的,它不是一个统一的度量,难以用一个统一的标准去定义它;
  •  Engagement更多的是从定性的角度来定义的,很多用户参与行为不能很好地量化,因此难以准确地度量;
  •  没有一个评判标准,对于一个网站而言用户参与度到底多少算是好;
  •  因为没有标准的定义,存在不固定性,因此不能作为衡量网站整体表现的参考指标。

  所以,我们可以认为Engagement是一个非标准化的度量,但绕开Avinash所提及的那些误区之后,也许Engagement也并非一无是处,至少它可以作为网站自身的分析指标,衡量用户的活跃度。

如何合理地定义Engagement

  如果你要用Engagement来衡量网站用户的活跃度,并且把它作为一个长期的指标进行趋势分析,那么首先在定义时必须确定那些被归为Engagement的行为是相对固定的,在短期内不会发生变化。如对于一个论坛而言,“发帖”和“跟帖”行为是持续不变的交互行为,这些可以作为识别用户是否参与的标准;而网站中的一个活动按钮或推广链接则不能作为识别Engagement的标准,因为推广活动一般是有期限的,在下线后用户的Engagement就会相应的降低,这样就会导致Engagement的不稳定性,也就失去了分析的意义(或者你只是为了单独分析该次推广活动的用户参与度,那另当别论)。

  这里先举两个例子,显示电子商务网站定义Engagement的例子:

  • 用户的注册行为;
  • 用户放入购物车或购买行为;
  • 用户的售前和售后的反馈行为;
  • 用户对商品的评价。

  再来看一下微博中可以定义为Engagement的一些行为:

  • 用户注册行为;
  • 发布新微博或转发微博;
  • 发表对微博评论;
  • 关注新的用户。

non-standard  可以看到电子商务网站的Engagement的定义与微博大相径庭,这也是为什么说Engagement是一个非标准化的度量的原因,网站间无法比较各自Engagement的优劣。所以Engagement应该作为网站内部分析指标,只用于衡量网站本身用户的活跃度变化趋势。

  即使是一个网站的Engagement也有不同的定义方法,比如我也可以在微博的Engagement定义中加入“收藏微博”的动作,所以我的建议是对于Engagement的定义,一个网站应该在一开始就形成一个标准,如果网站的性质没有发生大的变化就不要轻易修改定义,不然即使是作为网站自身的评价指标,它也不能很好的发挥作用。

  需要注意的是,Engagement只是用户的一系列动作或行为(Actions),并非网站的产出结果(Outcomes)。只能用于衡量网站用户活动的频繁度,进而分析网站用户近期的活跃程度,而不能用于衡量网站的效益

基于Engagement Index的分析

  这里首先推荐一篇Eric T. Peterson在Web Analytics Demystified上的文章——How do you calculate engagement? ,里面提供了关于Engagement的十分全面和精彩的分析。

  分析最好结合实例,所以这里还是以我的博客为例,假如我定义我的博客的Engagement包括以下的行为:

  1. 用户发表评论;
  2. 收藏或分享我的文章;
  3. 订阅我的博客或关注我;
  4. 停留时间(Time on site)超过3分钟。

  首先涉及到数据获取的问题,其实通过点击流+事件追踪,大部分用户的行为还是可以跟踪得到的,这里就不再详细展开了。

  接下去就是如何衡量Engagement。衡量Engagement的指标叫做参与度指数(Engagement Index),既然我们已经定义好了Engagement,我们就可以通过一些方法计算Engagement Index。这里建议Visit(或者叫Session)为单位计算用户一次访问是否Engaged,而不是计算每个Visit中Engage的次数,因为我们无法对某些行为精确定量它的次数,也许发表评论数可以计算次数,但是停留时间的长短就无法用次数来衡量,所以这里统一只判断一个Visit是否发生了上述的任何一类行为,发生则认为这次访问为Engaged,我们可以用一段形象的代码来解释:

boolean isEngaged(Visit) {
         if ( comment || share || feed || follow || time_on_site>=3min )
                  return true;
         else
                  return false; }

  通过调用上面的“函数”我们可以获取到哪些Visits是Engaged Visits,就可以计算出总的Engaged Visits的数量就是Engagement Index的值。但是单纯的一个Engagement Index似乎没有对比的价值,我们可以通过计算跟网站总Visits的比值获取用户的参与率(Engagement Rate)

Engagement Rate = Engaged Visits / All Visits

  也可以用下图来对比Engaged Visits与总Visits的关系:

engaged-visits

  也可以分析定义Engagement中各类行为发生的比率:

engaged-visits-piechart

  这里需要注意的是这个饼图中Visits的总和并非上面计算得到的Engagement Index,因为一个Visit可能既发表了评论,也订阅的博客,那么这个Visit就会被重复记录到两种行为的比例中。根据Engagement进行细分来源的的分析上面推荐的Eric T. Peterson的文章中已经介绍的非常详细,有兴趣的朋友可以自己去看下。

  如果你觉得还意犹未竟,认为那些用户参与的行为并非同等重要的,或许那些订阅了博客的用户或者在博客发表了评论的用户应该显得更加活跃,那么可以给这些行为赋予不同的权重,Sidney的博客中有过相关的介绍——网站分析的最基本度量(8)——Engagement,如果你想让权重显得更加客观和精确,可以使用我之前介绍过的层次分析法(AHP)来计算每个行为的权重,那么Engagement Index就是相应的加权和(定义每个Engaged Visits的数量为Ei,每个Engagement行为的权重为Wi):

engagement-index-wtd

分析Engagement的意义

  有时我们需要细分,而有时我们需要将指标进行聚合来评价总体表现。所以建议不要试图使用次数去计算每个Visit的Engagement Index是多少,次数会由于网站设计上的变化(页面布局、交互按钮的设计等方面的变化)及行为实现的多样性(如果你要发条微博,那实现的途径太多了)而呈现不稳定状态,使用Visits来度量的Engagement更具可比性,最总我们只是进行汇总来衡量整个网站的Engagement情况。

  那么Engagement对于网站来说到底有什么用呢?这里有个最简单的例子,当一个电子商务网站发现近几天的订单量并无发生显著的变化,但是用户活跃度却大幅上升,原因是某款商品的质量存在问题,大量的用户向网站反馈和抱怨,这时如果网站通过分析Engagement监控着用户的活跃度,那么就可以迅速地发现并作出反应。其实这个例子也说明了对于某些网站来说Engagement越高,网站的绩效不一定越好,两者没有直接的联系。

  我们已经步入WEB2.0的时代,用户与网站间的交互更加频繁,网站需要更多活跃用户来增加自身的活力,用户的参与有效地提升了网站与用户之间的信息互通,为网站带来活力的同时也为网站创造着更多的信息,而且很多都是网站本身忽略的或者无法提供的有价值信息,而这些“用户智慧”的注入无疑可以为网站带来更多的关注。

优化网站导航设计

——让用户更容易地找到需要的信息3

optimize-navigation  之前已经介绍过为了让用户更容易地找到需要的信息,可以对网站的信息架构和站内搜索进行分析和优化,而另一个能对用户起到很好引导作用的就是网站的导航功能,所以这篇文章主要分析用户对网站导航功能的使用情况,并在此基础上合理地优化网站的导航设计。

网站导航的作用

  网站导航的最终目的就是帮助用户找到他们需要的信息,如果说得详细点,那么可以概括为下面3个用处:

  1. 引导用户完成网站各内容页面间的跳转。这个是最常见的,全局导航、局部导航和辅助导航等都是为了引导用户浏览相关的页面;

  2. 理清网站各内容与链接间的联系。即对网站整理内容的一个索引和理解,这个最常见的应用就是网站地图和内容索引表,展现了整个网站的目录信息,帮助用户快速找到相应的内容;

  3. 定位用户在网站中所处的位置。这个在面包屑导航中得到了充分的体现,它帮助用户识别当前浏览的页面与网站整体内容间关系,及其与网站中其它内容的联系和区分。

网站导航的分析

  通过分析用户使用网站导航功能的情况,可以来评估网站各导航功能设计上的优劣,这里主要从导航的利用率实现度有效性符合度4个方面进行分析:

利用率

  网站导航的利用率,即用户使用各类导航功能的情况。最直观的分析方法就是使用点击热图,具体可以参考我之前的文章——网站点击热图,也可以使用页面覆盖图(Overlay),Google Analytics上面默认提供了网站首页的Overlay:

homepage-overlay

  从图中可以区分网站首页各区域导航功能的使用情况,包括顶部导航,侧边栏的各导航模块等。如果是独立的导航索引页面,我们可以查看这些页面的浏览次数(Pageviews)访问量(Visits)等指标来分析它们被使用的情况。比如你通过点击我的博客顶部导航中的“网站地图”进入了分类导航索引页面,会看到该页面的URL地址为http://webdataanalysis.net/site-map/,我们可以在Google Analytics上面通过filter来查看该页面的访问情况:

sitemap-pageview

  通过比较各导航页面的这些指标我们可以分析得到用户对导航功能的整体使用情况以及各导航的使用比例或使用偏好。

实现度

  我们需要知道当用户试图使用导航功能时,有多少用户真正点击导航中的链接或者有多少用户进行了下一步操作。所以这里可以分析各导航页面的点击转化率(CTR),即用户在导航页中的点击次数/导航页面被浏览的次数,其实上面页面覆盖图指直接给出了页面中每个可点击对象的点击转化率,你可以将它们汇总就是整个页面的点击转化率,也可以查看导航页面各链接的点击转化率。但Google Analytics上面无法提供一些子页面的覆盖图,只能选择其它的工具或者试图监控导航页面所有的点击事件。

  另外一种分析导航功能实现度的方法就是通过离开率(Exit Rate)这个指标,如果一个用户进入了导航页面后直接离开了网站,那么导航的功能就没有实现(当然如果用户返回了上层页面或者回到首页,导航功能同样也没有实现,这些操作无法体现在Exit Rate)。比如我的博客的分类目录导航页面,该类页面的URL地址都会包含“/category/”,所以也可以在GA上面直接filter出来所有这类地址,我们看看这些页面的Exit Rate情况,如下图:

category-statistics

  这里因为缺少导航页面Exit Rate的评判基准,所以我无法判断我的导航页面效果到底如何,有兴趣的朋友可以在下面的评论把你们的网站或博客导航页面的Exit Rate贴上来看看,大家交流比较下。

有效性

  与网站的内容页面不同,导航页面的目标是让用户更快地找到想要的信息,我们不需要用户过久地停留在导航页,正如Google的口号:We may be the only people in the world who can say our goal is to have people leave our homepage as quickly as possible(让用户尽快离开自己的网站)。

  所以对于导航页面而言,页面平均停留时间(Avg. Time on Page)越短,则该导航页的质量就越高(当然用户要有点击才行)。页面平均停留时间也是GA中分析页面的基本度量,上图也有显示。

符合度

  或者称为导航的效果,用户在使用导航功能找到相应的页面后,是否对该页面提供的信息感兴趣,或者说这些是不是他们想找的信息。

  假设用户在使用导航功能后找到了需要的信息或者完成了预期的任务,那么在行为可能表现为在使用导航后继续在网站停留了一段时间,或者用户最终到达了任务的成功页面或网站的目标页面(如用户完成注册、电子商务网站下单或购物成功等)。所以我们可以使用导航的后续停留时间任务完成度目标转化率这些分析度量来衡量导航的实现效果到底如何。

  总结一下:

  1. 用点击热图、Pageviews和Visits来衡量各导航的使用情况,点击或浏览越多,说明该导航的利用率就越高;
  2. 用点击转化率(CTR)和离开率(Exit Rate)来衡量导航的实现度,CTR越高、Exit Rate越小,说明导航的实现度越好;
  3. 用页面平均停留时间(Avg. Time on Page)来衡量导航的有效性,用户在页面的停留时间越短,说明导航的功能越有效(基于导航已经拥有较好的实现度);
  4. 用户在使用导航后的停留时间及任务完成度、目标转化率可以衡量导航的符合度,用户的任务完成度或目标转化率越高,则导航的符合度越高。

导航设计的优化

  基于对以上4个方面的分析,我们可以对网站进行针对性的优化。

a) 提高有效导航的利用率,将用户最常用或效果最佳的导航放在最醒目的位置;

  结合上面的分析,将那些利用率高,效果好的导航功能放到醒目的位置,让用户更方便地使用这些功能。

b) 去除无效导航或者无人使用的导航,精简网站设计;

  导航功能并不是越多越好,只要提供够用、有效的导航就行,结合上面的利用率和实现度,将那些没人使用或点击转化较差的导航功能进行精简。

c) 提高导航描述与对应内容的关联度,不要误导用户,赢得用户的信任并保持用户对网站的兴趣;

  不要试图去做标题党,如果一个导航页面拥有了较好的利用率和实现度,那么千万不要辜负用户的期望,为他们提供相符的高质量的内容,这样才能真正地留住用户。

d) 优化导航页面内容的组织和展示。

  如果有效性不高,用户经常需要在导航页中逗留一段时间才能找到自己想要去的地方,那么也许导航页就失去了其最根本的价值。如何更好地展示导航的内容可能是一个复杂的问题,涉及信息设计、分类、排序等多方面,或者有些网站设计师能想出一些别出心裁的展示方式来吸引用户的眼球,这里直接上张图吧:

search-cube

  好了,我对网站导航的分析优化说完了,你是否还有更多高见,欢迎在下面评论分享。

网站分析的应用和价值

Web-Analytics  前几天突然想到,如果有人问:“网站分析主要是干什么的?投入成本来进行数据收集和数据分析又有何意义?”也许我第一反应的回答是:“网站分析能帮你更好地优化网站和推广网站。”但仔细想想,这些问题确实没有深入地思考过,也许我们日常中更多去探究网站分析的方法和实现,而对于网站分析的根本意义却没有真正地去想过。所以,这里整理了一下个人看到的目前网站分析的一些应用及体现出来的价值,算是对上面问题的一个简单回答。

监控网站的运营状态

  网站分析最基本的应用就是监控网站的运营状态。收集网站日常产生的各类数据——点击流数据、运营数据、用户数据等,并通过统计这些数据生成各类网站分析的报表,对网站的运营状态进行系统地展现。从点击次数、浏览次数、用户数的变化趋势,到比较新老用户比率、页面流失率和目标的实现率,数据帮助运营者从多角度观察网站的状况是否良好。

  如果没有网站分析的日常报表数据,无疑会让网站运营者感到恐慌,因为他们失去了对网站现状的感知,也许网站一天会有几千几万的访问量,也有可能只有个位数的用户访问了网站,这样网站的运营就像是闭门造车,没有了目标和方向。

  当然,有些网站的数据不仅能监控自身网站的运营状况,而且互联网或某些领域的发展状态提供参考依据,Google的搜索趋势、百度的搜索风云榜是网络热点的风向标,当然我们现在可能会更多地去关注微博上的实时热点信息;淘宝的数据中心为电子商务的交易趋向提供依据。

提升网站的推广效果

Website-promotion  说到网站推广,也许最先想到的就是SEOSEM,但网站分析不仅能够提升网站在SEO和SEM上的表现,同时其对网站的精准营销也能起到有力的支持。

SEO和SEM

  SEO和SEM是网站分析中很重要的一块,因为它们是网站获取流量的重要途径,而流量又是网站的基础,所以我们必须清楚的把握网站在SEO和SEM方面的表现。

  分析SEO主要是分析网站在各搜索引擎的相关关键词排名、搜索词的点击转化率(CTR)及网站在搜索引擎的收录情况、外链数据、错误页面等,关于SEO网上的介绍很多,最关键的还是网站自身的内容质量及在SEO上面的优化。

  SEM的效果很多是通过计算各关键词或者推广来源的投资收益(ROI)来衡量的,一般投入成本比较容易衡量,而产出收益的衡量就会相对困难,需要细分各来源和关键词,电子商务还有直接的利润可以衡量,如果只是信息发布引导线下交易那么分析会困难得多,网上也有很多这方面的文章可以参考。

精准营销

  SEO和SEM提高了网站的曝光率,让用户能够更容易地找到我们的网站,但有时我们也需要将我们的网站定向地推给某些用户,也就是网站推广中最常见的线上推广。

  这里主要包括用户细分、来源细分和目标市场的细分,通过用户行为分析进行的用户细分让我们能够了解网站主要吸引的是哪类用户,基于来源的搜索关键词和来源网站可以了解用户主要关心网站的哪些信息以及他们会通过哪些相关的途径找到我们,这为我们的线上推广指明了方向。如果网站要发布一个产品或者做一个活动,也许这时候你就清楚的知道需要给那些用户发直邮,在哪些网站上投放广告,推广的内容应该如何组织能够吸引到更多的用户……

  我之前的很多关于用户分析的文章介绍了如何更好地去发现网站的忠诚客户、有价值客户,以及用定量的方法去评价网站的用户,其实这些也为网站的精准营销提供了很好的参考依据。

线下推广效果

  除了线上推广外,很多网站也会定期进行线下的推广。线下的活动和推广往往会直接展示网站的URL地址,在数据的表现上以直达流量为主,所以评估线下推广效果的关键在于区分哪些流量来源于线下推广?其实网站分析的数据获取途径十分广泛,我们可以通过一些特殊的手段来做到这一点。

  比如你会发现Avinash Kaushik的书里面引用的很多网址是类似短网址(Short Url)的形式,通过跳转转到相应的页面,线下推广也可以借用这种方式,在线下公布一个特殊的专用于某次推广的网址(如http://webdataanalysis.net/offline)重定向到目标页面(如http://webdataanalysis.net/),这样在网站分析中只要选取那些来源是公布出去的特殊的URL(如http://webdataanalysis.net/offline)的浏览就可以统计线下推广的效果了,当然也可以使用URL参数的方式在目标URL后面加上类似?from=offline&campaign=……的参数,通过统计这些参数页面被浏览的次数并细分各线下推广途径的效果。  但这里有个问题就是,网址往往是网站品牌的一大要素,尤其是那些直观易记的网址,所以线下推广偏向于使用原始的网站地址,以便于有更好的辨识度,让用户记住这个网站,这就给网站分析的流量区分带来了一定的难度,也许只有通过访问流量的趋势分析来衡量线下推广的效果了。

优化网站的用户体验

User-Experience  通过对外推广,也许已经有很多用户开始进入并访问你的网站了,但用户是否会对你的网站感兴趣,或者是否能够持续访问变成网站的忠实用户,这些就取决于你的网站是否有留住用户的能力了,也就是你的网站是否具有足够好的用户体验,来实现用户的期望和满意度

简单有效的交互流程

  无疑,那些简单易用的交互流程能够帮助用户更好地实现他们的操作和目标,而用户也会更喜欢使用那些设计得更加人性化的网站,能让他们随心所欲的穿梭其间。

  我们通常会用转化率(Conversion Rate)任务完成率(Task Completion Rate)来衡量网站交互的效果,而对于某些基于任务或者应用导向的网站,这方面的分析尤其重要。通过分析找出一些交互中的不足和遗漏环节或者化繁为简,能够有效提高转化率及用户完成任务的几率,从而有效提高网站的收益。

帮助用户找到感兴趣的内容

  我的博客中近期的几篇文章都介绍了如何让用户更好地找到需要的信息,其中包括优化信息架构、优化站内搜索等,这些无疑都能更好地留住用户,让他们继续浏览网站的内容或者继续使用网站的提供的服务。

  与其被动地让用户自己去寻找感兴趣的内容,不如主动地将一些用户可能感兴趣的内容推荐给用户,也就是现在很多网站都在做的基于用户行为分析的关联推荐功能,我之前的文章也介绍过网站数据分析在这方面的应用。

倾听用户的心声

  也许很多人对网站分析的概念还停留在网站的日常数据报表上,其实网站分析的范围远不止这些,用户问卷调研(Survey)可用性测试(Lab usability testing)、以及我之前介绍过的实景调研(Site visits)都属于网站分析的范畴,Avinash Kaushik把它们归为网站分析中的定性分析(Qualitative Analysis)。也许你会说这些不是UED或者UCD们的工作吗?是的,这些分析的目的都是为了提升用户体验,UED们是用户体验方面的专家,而网站分析师在数据的获取和分析方面更加专业,所以为什么不合作呢?网站分析师提供分析的方案和结果,再由用户体验小组完成优化方案的设计并实施,不要纠结于网站分析工作一定由哪个部门或团队来做,所有的工作都是为了提供更好的用户体验。

  正是这些定性分析的方法能够让我们近距离的聆听用户的声音,对满足用户需求,更好地进行网站的内容设计、功能设计,甚至交互导航设计都能起到关键作用。

  最后做下简单的总结,如果网站就是为了流量而活的话,那么我们可以将上面网站分析的应用和意义归纳为:监控流量吸引流量保留流量,流量意味着用户,用户意味着网站的生命。

  但也许现在我们该考虑下社会化媒体的影响了,不仅仅是SEO和SEM。Twitter的关键词广告平台、移动设备——手机、ipad的应用普及,今后的网站分析可以做得更多,对网站产生的价值也会越来越大。也许上面我提到的只是网站分析的冰山一角,现在有越来越多的人开始从事网站分析并喜欢上了这一职业,网站分析的发展日新月异,一定会有更多的新的应用,让我们拭目以待。