数据的报表和报告

  最近一直很忙,所以博客的更新频率会相对慢一点。今天想聊聊关于数据展现方面的几个看法,数据在后台经过各种的计算和处理最终得到了一些合理和直观的指标,我们需要将这些指标展现给数据的需求方,其中就会涉及数据的展示方式和数据的可视化的问题。可能这些问题日常并不被数据处理人员所重视,数据处理人员更关心数据的完整性、一致性、准确性和及时性,而对于数据的展现,更多的是只要数据能够到达需求方的手里即可,很少会有人花心思去关注数据的展现是否合理,需求方是否能够理解数据的含义,理解是否一致,数据是否通俗易懂这些问题。但这里需要说的是,其实数据的展示非常重要,它直接影响看数据的人能否用最短的时间去读懂数据、理解数据,去合理地应用数据,让数据产生价值,最终会影响到用户对数据的兴趣,而一旦用户对每天繁琐累赘的数据失去耐心的时候,数据的价值也会随之泯灭。

  这里主要介绍日常最常提到的两类数据展现方式——报表和报告,从字面上看好像大同小异,但其实两者发挥着截然不同的功效。

报表

  说起报表大家都不会陌生,数据分析师每天都需要看各类形形色色的报表。报表主要展现的是数据的值、趋势、比例等,所以报表只能体现数据上的表现,数据的异常和变化情况。

  报表的展现方式主要包括两类,一类是目前最常见的WEB报表,基于B/S架构的报表系统可以提供支持多人同时登陆和查看相关的数据;另一类就是基于客户端的数据展现,最常见的就是我们会用Excel来制作报表。

  WEB端的报表可以直接通过浏览器登录进行查看,最常见的就是Google Analytics、百度统计等第三方网站分析工具的数据展现,将数据托管到了它们的服务器上提供SaaS的服务;

GA-Dashboard

  WEB报表另一类就是BI报表工具,与第三方工具的不同之处在于系统搭建在自己的服务器上,数据自然也保存在本方,能够保证数据的隐私和安全。定制性也会比第三方工具高一些,除了提供自定义Dashboard、简单的数据筛选等功能外,还可以自己制作报表、定制图表,提供各类Query和Hint组件,而且随着BI功能的不断发展,大部分的BI报表都提供了多维模型的制作和OLAP的展现。国外知名的BI工具包括IBM的Cognos,Oracle的BIEE及SAP的BO(Business Object),国内比较熟悉的水晶报表是BO面向中心企业的一套解决方案;开源的BI工具在国内用的最普遍,文档资源最丰富的要数Pentaho;国内的BI工具目前不多,前段时间发现用友有个BQ的商务智能平台,但没有细致了解,所以不好评述。

BI-Dashboard

  客户端的报表将数据读取到本地进行查看,所以优势在于数据的响应速度很快,可以随意的更改和处理数据,不用顾忌对原数据的损坏,所以最大的好处就在于对数据操作的灵活性;而相应的不足就在于数据并不是最新的,每次需要去刷新数据,当遇到数据量比较大时,刷新的效率就会很低,并且对于能够承受的加载数据量也没有WEB端多。所以这也是目前WEB报表比较流行的原因。

报告

  报告所体现的作用其实与报表截然不同,报表所能解释的问题仅限于数据层面,而报告则丰富得多,报告应该能够从各方面,包括产品状况、运营状况、市场推广状况、销售状况甚至总体的战略经营状况,对数据的表现提供业务和决策层面解释,从而分析和总结业务和决策上的问题,为有效的优化提供支持。

  所以报告是对报表的一种提炼,不再局限于数据本身,而是要通过数据去寻找业务层面的原因,所以往往报告上的解释和总结对于公司的整体运营更有价值,报告是数据分析提炼的一个必要环节。

Excel报表实例

  相信正在看这篇文章的人有99.9%用过Excel来查看、处理和分析数据,所以对于Excel里面一般的表格和图表都在熟悉不过了,我不是使用Excel的佼佼者,所以这里不去班门弄斧了。但从数据分析的角度,其实Excel里面的一类功能非常实用,而且能够非常方便地实现数据的汇总和细分,就是数据透视表

  数据透视表是作为报表来展现数据的一种很好的方式,有以下几个优势:

  • 可以连接外部数据源将数据导入Excel,Excel几乎支持所有数据库作为外部数据源,通过数据—获取外部数据来进行数据源的连接数据,并导入数据。
  • 可以实现数据刷新,Excel支持后台、定时和打开刷新这几种数据的更新方式,所以解除了需要手工输入维护数据的烦恼;
  • 支持多种数据聚合方式,求和、计数、平均值、最大最小值等;
  • 支持基本的OLAP操作,包括下钻(展开)、上卷(汇总)、切片(单项筛选)、切块(多项筛选)和旋转(行列交换)。

  下面是我从Oracle导入制作的一个数据透视表示例,下面提供了Excel文件的下载,大家有兴趣的可以下载过去自己玩玩:

Excel-Pivot-Sample

点击下载:Excel透视表示例

  好了,趁着春节前一小段闲暇跟大家分享了我对报表和报告的理解,以及用Excel制作的一个最简单的交叉透视表,这也是近段时间我所进行的工作的其中一块,希望大家能够受用。无论你现在是不是足够重视数据的可视化,无论你现在有没有精心地去制作各类报表和报告,我想说的是请尊重数据的用户,我们要让用户更愉悦地去看数据,这样才能让用户更好地理解数据和应用数据,而这个正是数据的用户体验所在。

  最后,提前祝大家春节愉快,跟家人好好聚聚,过一个温暖惬意的春节。

数据的报表和报告》上有 11 条评论

  1. brnjah

    前几天用手机版的GooglerReader躺在床上一口气看了好几个小时。很惭愧今天才来膜拜博主。这真是个对我极其有帮助的好网站,感谢博主的分享。

    回复
  2. Pingback 引用通告: 多维交叉分析 | 行走在互联网路上

  3. Pingback 引用通告: 多维交叉分析 | 欧可建个人博客

yoyo 进行回复 取消回复

电子邮件地址不会被公开。 必填项已用 * 标注

您可以使用这些 HTML 标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>