首页 > 个人观点分享 > 网站用户的识别

网站用户的识别

2010年3月7日 由 joegh    留言 »

web-users  用户分析是网站分析中一个重要的组成部分,在分析用户之前我们必须首先能够识别每个用户,分辨哪些是”New Customer”,哪些是”Repeat Customer”。这样不但能够更加清晰地了解到底有多少用户访问了你的网站,分辨他们是谁(用户ID、邮箱、性别年龄等);同时也能够帮助你更好地跟踪你的用户,发现它们的行为特征、兴趣爱好及个性化的设置等,以便于更好地把握用户需求,提升用户体验。

  通常当你的网站提供了注册服务,而用户注册并登陆过你的网站,那么用户可以更容易地被识别,因为网站一般都会保存注册用户的详细信息;但是你的网站并不需要注册,而用户的行为以浏览为主,这是用户识别就会显得较为困难,下面提供了几种常用的用户识别的方法:

识别用户的几种方法

  当用户并未注册登录的情况下,识别用户的唯一途径就只剩下用户浏览行为的点击流数据,通常情况下它们会保存在WEB日志里面,关于WEB日志的详细说明可以参考我之前的文章——WEB日志格式。而WEB日志本身存在的缺陷可能导致用户识别的不准确性,关于WEB日志的缺陷可以参考之前的文章——WEB日志的作用和缺陷,所以我们在选择用户识别方法的过程中,在条件允许的情况下尽量选择更为准确的方法:

1、基于IP的用户识别

  IP地址是最容易获取的信息,任何的WEB日志中均会包含,但其局限性也较为明显:伪IP、代理、动态IP、局域网共享同一公网IP出口……这些情况都会影响基于IP来识别用户的准确性,所以IP识别用户的准确性比较低,目前一般不会直接采用IP来识别用户。

  获取难度:★

  准确度:★

2、基于IP+Agent的用户识别

  同样基于最简单形式的WEB日志,我们可以增加一项——Agent,来提高单一IP方式识别用户的准确性。Agent也是WEB日志中一般都会包含的信息,通过IP+Agent的方式可以适当提高IP代理、公用IP这类情况下用户的分辨度,同时通过Agent还可以识别网络爬虫等特殊“用户”,但同样准确度也欠高。

  获取难度:★

  准确度:★★

3、基于cookie的用户识别

  当你通过自定义Apache日志格式或者JavaScript的方法获得用户cookie的时候,其实你已经找到了一个更有效的用户识别的手段。cookie在未被清除的其前提下可以认为是跟某个访问客户端电脑绑定的(一个客户端有可能包含多个cookie),所以用cookie来标识用户其实指的是用户使用的客户端电脑,而并非用户本身。

  用cookie识别用户的方法当然也存在缺陷:最常见的就是cookie被清除而导致用户无法与原先记录实现对应;同时由于客户端电脑会被共用,或者用户会在不同的电脑上访问你的网站,这个时候cookie就无法直接对应到该用户了。

  获取难度:★☆

  准确度:★★☆

4、基于用户ID的用户识别

  基于用户ID的用户识别是最为准确,因为一般情况下用户不同共享他的用户ID,所以我们可以认为数据中的userid唯一地指向该用户,几乎不存在偏差。当然要使用用户ID来识别用户是需要一定的前提条件的:网站必须是提供用户注册登录服务的,并且可以通过一些手段在点击流数据中记录userid。

  获取难度:★★

  准确度:★★★

  所以对于一个需要用户ID注册登录的网站来说,用户唯一标识符的选择可以遵从以下顺序:当用户注册登录时以userid为准,当用户在未登录状态浏览时以用户的cookie为准,当用户未登录且cookie无法获取的情况下以IP+Agent为准;这样就能从最大程度上识别唯一用户。

  这里推荐一个网站日志中cookie项的自定义设置方法,以便更好地识别用户。cookie是从用户端存放的cookie文件记录中获取的,这个文件里面一般在包含一个cookieid的同时也会记下用户在该网站的userid(如果你的网站需要注册登陆并且该用户曾经登录过你的网站且cookie未被删除),所以在记录日志文件中cookie项的时候可以优先去查询cookie中是否含有用户ID类的信息,如果存在则将用户ID写到日志的cookie项,如果不存在则查找是否有cookieid,如果有则记录,没有则记为”-”,这样日志中的cookie就可以直接作为最有效的用户唯一标识符被用作统计。当然这里需要注意该方法只有网站本身才能够实现,因为用户ID作为用户隐私信息只有该网站才知道其在cookie的设置及存放位置,第三方统计工具一般很难获取。

获取用户信息的途径

  通过以上的方法实现用户身份的唯一标识后,我们可以通过一些途径来采集用户的基础信息、特征信息及行为信息,然后为每位用户建立起详细的Profile:

  1) 用户注册时填写的用户注册信息及基本资料;

  2) 从网站日志中得到的用户浏览行为数据;

  3) 从数据库中获取的用户网站业务应用数据;

  4) 基于用户历史数据的推导和预测;

  5) 通过直接联系用户或者用户调研的途径获得的用户数据;

  6) 有第三方服务机构提供的用户数据。

识别并获取用户信息的价值

  通过用户身份识别及用户基本信息的采集,我们可以通过网站分析的各种方法在网站是实现一些有价值的应用:

  • 基于用户特征信息的用户细分;
  • 基于用户的个性化页面设置;
  • 基于用户行为数据的关联推荐;
  • 基于用户兴趣的定向营销;
  • ……



 » 本文采用 BY-NC-SA 协议,转载请注明来源:网站数据分析 » 《网站用户的识别》

相关文章:

  1. 网站用户的生命周期价值
  2. 提升用户满意度
  3. 网站分析的基本度量
  4. 直邮营销分析(上)
  5. 不得不考虑的时间因素

33 条评论

  1. 蓝鲸 说:

    每一种方法都解释的很详细。学习了。感谢博主分享经验。

    回复回复
  2. joegh 说:

    你的博客中关于Google Analytics的应用和介绍也很精彩,让我收获很多。多谢那个标签插件的推荐,我找时间也换了。

    回复回复
  3. Keven 说:

    哈哈 你也用了我推荐给蓝鲸的插件啊
    多多交流 做个友链吧!

    Keven的网站分析博客 http://www.xiaohai26.com

    回复回复
  4. joegh 说:

    这个居然被当成垃圾评论了,囧,今天才发现,已经加你的博客链接了,以后多交流。

    回复回复
  5. Keven 说:

    呵呵 我每天的垃圾评论平均两千个 最近加了回复验证码才解决掉

    回复回复
  6. laird.zheng 说:

    互联网用户识别的确是一块比较头疼的事情,没有什么有效的方法,每种方法都有其弊端,不能尽善尽美。

    回复回复
  7. yoyo 说:

    解释的非常清楚。谢谢。。我想大多数网站将userid信息写入cookie可能只是想方便用户下一次快速登陆。没想到给网站数据分析开辟了桥梁,能让每个用户的点击流数据和运营数据匹配起来。非常棒,虽然我还没有机会拿到这么全面的数据。

    回复回复
  8. vincent 说:

    终于爱上这里了,~~
    哇哇哇
    牛人哇哇哇好多,

    回复回复

Trackbacks /
Pingbacks

  1. 网站用户的生命周期价值 — SEM KNOWLEDGE BASE|搜索营销智库
  2. 向上营销、交叉营销与关联推荐 | 鸟人网
  3. 网络营销博客.ALi,专注网络营销,分享网络营销.
  4. 网站新老用户分析 - Hello Tea-阿茶的茶馆
  5. 网站新老用户分析 ‹‹ 网客设计
  6. 网站新老用户分析 » 互联网杂谈
  7. Google Analytics中的IP地址 » 互联网杂谈
  8. Google Analytics中的IP地址 » 网站优化
  9. Google Analytics中的IP地址 |转载文章 | 互联网营销推广策划和数字电视运营
  10. Google Analytics中的IP地址 |转载文章 | 网站优化,互联网营销策划,数字电视运营
  11. 网站新老用户分析 « 电商宝博客
  12. 网站用户的识别 | 柯枫博客
  13. 网站用户的生命周期价值 | 综蓝花园
  14. 景飒 » 向上营销、交叉营销与关联推荐
  15. 向上营销、交叉营销与关联推荐 | 优酪网
  16. 向上营销、交叉营销与关联推荐 | 互联网有些事biog-崇尚专注 | 聚焦互联网开发信息
  17. 向上营销、交叉营销与关联推荐 App-Goog-les
  18. 向上营销、交叉营销与关联推荐 | Liang's Blog
  19. 向上营销、交叉营销与关联推荐 | 互联网与电子商务研究
  20. 向上营销、交叉营销与关联推荐 | 在路上
  21. 向上營銷、交叉營銷與關聯推薦 - Game2 網誌
  22. 向上营销、交叉营销与关联推荐 | 电商聚读
  23. 向上营销、交叉营销与关联推荐 | 8小时 — 我们自由分配的时间!
  24. 向上营销、交叉营销与关联推荐 - 博客 - 伯乐在线
  25. zz 向上营销、交叉营销与关联推荐 | 互联网的那点事 - 他山之石 - 锦瑟华年

留下评论