在网站数据分析中,时间是最常见也是最不可或缺的维度之一,大部分情况下用于限定指标统计的范围和粒度,同时时间因素也会对指标的一些统计规则和细节造成影响,而在某些数据分析中我们很容易忽略时间因素的影响,这些影响可能误导最终的结论。
发现这个问题是在一个数据提取的需求中,网站每天会发布很多新的内容,这些新的内容需要进行推荐,不然就会被埋没,所以很多网站都会有“最新推荐”之类的模块,而这个数据需求就是......» 阅读更多: 不得不考虑的时间因素 存档在 ‘个人观点分享’ 分类
不得不考虑的时间因素
2012年2月28日
在网站数据分析中,时间是最常见也是最不可或缺的维度之一,大部分情况下用于限定指标统计的范围和粒度,同时时间因素也会对指标的一些统计规则和细节造成影响,而在某些数据分析中我们很容易忽略时间因素的影响,这些影响可能误导最终的结论。
发现这个问题是在一个数据提取的需求中,网站每天会发布很多新的内容,这些新的内容需要进行推荐,不然就会被埋没,所以很多网站都会有“最新推荐”之类的模块,而这个数据需求就是......» 阅读更多: 不得不考虑的时间因素 基于KNN的相关内容推荐
2011年10月27日
如果做网站的内容运营,相关内容推荐可以帮助用户更快地寻找和发现感兴趣的信息,从而提升网站内容浏览的流畅性,进而提升网站的价值转化。相关内容推荐最常见的两块就是“关联推荐”和“相关内容推荐”,关联推荐就是我们常说的购物篮分析,即使用购买了某商品的用户同时购买了什么这个规则来发现商品间的潜在联系,之前有相关的文章介绍——向上营销、交叉营销与关联推荐;关联推荐是基于用户行为分析的推荐,而相关内容推荐是基于内容固......» 阅读更多: 基于KNN的相关内容推荐 网站的迷失度度量
2011年5月10日
在博客之前的文章——优化网站信息架构我曾经提到过关于迷失用户(Lost Visits)的定义,以及如何使用Google Analytics的高级群组(Advanced Segment)去区分出这批用户。最近在看《用户体验度量(Measuring the User Experience)》,发现自己实在太嫩了,人家Smith早在1996年就对迷失度(Lostness)有了定义,同时给出了迷失度L的计算公式,这里借花献佛,分享给大家。
即,L = sqrt[ (N/S-1)2 + (R/N-1)2 ]
L:迷失度
N:访问......» 阅读更多: 网站的迷失度度量 值得关注的用户指标
2011年3月28日
最近最常被问到的就是一些用户的统计指标,无论是决策层还是产品部门,所以这篇文章重点说下用户指标的一些内容。
假设你想用尽量简洁有效的数据了解一个网站或产品的用户情况,你会问哪几个用户数据?其实一个聪明的提问者永远不会问网站的累计用户数有多少,甚至不会问网站的UV是多少,因为这些指标都不能从真正意义上去反映网站的价值和发展状况。
举个简单的例子——网秦,累计用户数应该不下千万,但这个数字真的能够体现......» 阅读更多: 值得关注的用户指标 排行榜与随机数
2011年3月13日
下面要介绍的内容也是前几天在工作中实际遇到并尝试去解决的一个问题。公司有一个优秀的团队,每个人都在思考如何解决目前存在的一些不合理的问题,无论是产品设计、内容运营还是后台架构。下面解决的问题就是源于一个数据的需求,根据需求进行设计和总结思考,同时也需要不断尝试着进行调整和优化。
其实无论是电子商务网站的商品交易量、内容网站的页面浏览量还是资源网站的资源下载量,大部分都会存在排行榜这个东西。排行榜提供了......» 阅读更多: 排行榜与随机数 关键转化路径优化
2011年2月20日
其实网站分析中很重要的一块就是网站的关键转化路径分析,可能很多的网站分析师在这一方面都倾注了大量的时间和精力,尽最大的努力寻找最优的转化路径,因为优化关键转化路径相当于提高转化率,进而提高网站收益。所以,尤其对于电子商务网站或者付费服务网站而言,关键转化路径分析尤为重要。之前的文章——网站转化率与漏斗模型对关键路径的定义和分析做过简单介绍,同时推荐了一个非常形象的数据展现方式——漏斗模型,能够让每一步的转化看起......» 阅读更多: 关键转化路径优化 数据的报表和报告
2011年1月30日
最近一直很忙,所以博客的更新频率会相对慢一点。今天想聊聊关于数据展现方面的几个看法,数据在后台经过各种的计算和处理最终得到了一些合理和直观的指标,我们需要将这些指标展现给数据的需求方,其中就会涉及数据的展示方式和数据的可视化的问题。可能这些问题日常并不被数据处理人员所重视,数据处理人员更关心数据的完整性、一致性、准确性和及时性,而对于数据的展现,更多的是只要数据能够到达需求方的手里即可,很少会有人花心思去关注数据......» 阅读更多: 数据的报表和报告 时间序列的趋势分析
2010年12月22日
——数据的上下文1
无论是网站分析工具、BI报表或者数据的报告,我们很难看到数据以孤立的点单独地出现,通常数据是以序列、分组等形式存在,理由其实很简单,我们没法从单一的数据中发现什么,用于分析的数据必须包含上下文(Context)。数据的上下文就像为每个指标设定了一个或者一些参考系,通过这些参照和比较的过程来分析数据的优劣,就像中学物理上的例子,如果我们不以地面作为参照物,我们无法区分火车是静止的还是行进的,朝北......» 阅读更多: 时间序列的趋势分析 用户需要什么数据?
2010年12月1日
这里首先需要说明的是标题中的“用户”指的是数据的用户,或者数据的需求方,这些用户往往不是网站或企业面向的外部用户,数据的消费者通常是公司内部各个部门和领域的人员。
为什么会提出这个问题,其实我们经常会遇到这样的情况:公司的高层抱怨从报表里面看不到有用的东西,是不是可以对报表做下整理(于是下面就忙开了),但是该怎么整理或者他们到底需要的是什么数据(好吧,高层的需求一般是不会明说的,我们要试着自己去揣摩......» 阅读更多: 用户需要什么数据? BI应用中的三大矛盾
2010年11月22日
因为近期工作的变更,一直在忙一些杂七杂八的东西,工作交接、离职手续及对新工作的思路整理,目前还处在这个阶段,所以可能近期没有比较新的内容跟大家分享,最近的几篇文章会以一些总结的内容为主,主要是对之前的工作中的一些感想。但相信之后会有更加丰富的数据分析相关的内容向大家呈上,因为我相信我要去的新公司是一个朝气蓬勃、充满创意和挑战的地方,而最重要的是他们对数据的重视和理解。
看到文章标题,相信大家已经知......» 阅读更多: BI应用中的三大矛盾 





