让URL更适合分析

url-optimization   网站的存在离不开URL,URL与网站内容形影不离。URL用于唯一地标识网站的页面、内容或资源的“位置”,所以很多时候它只是被看做一种识别码,就像是商品上的条形码,对于用户来说,这些识别码是没有任何意义的,用户不需要关心它们到底代表着什么。但对于网站分析而言,URL并不只是网站内容的识别码这么简单,其实它可以在分析过程中发挥更大价值。

URL与网站内容

  URL由协议、域名、请求地址三部分组成,完整地URL唯一确定了一个请求的资源,可以是页面、内容模块、文件或多媒体资源等。对于网站而言,URL的用处是对资源的唯一定位,所以方式可以有很多,用资源的唯一描述(资源名称或简称等),资源的唯一识别码(ID、数字标记等),也可以是动态参数,这样就导致了各网站的URL会存在很大的差异。

  比如浏览网易首页=>体育频道=>意甲=>米兰新闻,它们的URL依次为 http://www.163.com/=> http://sports.163.com/=> http://sports.163.com/yj/=> http://sports.163.com/special/00051NSK/moremilan.html,其实对于用户而言对于前三个页面的URL还可以读懂,而最后一个可能就难以理解了;而在去看一下淘宝的URL,在进入首页后点击任一一个商品分类,可能展现出来的URL就已经很难读懂了。

  无论怎么样,这些URL对于网站而言都是有效的,因为它们都能做到唯一地识别网站的内容,既然如此,那么是不是URL就不再需要进行另外的整理设计了呢?还是先看看URL在网站分析中扮演着怎样的角色。

URL在网站分析中的用处

  我们知道,在网站分析中一般都是用页面的URL地址来唯一地标识一个页面(当然现在GA上也有根据页面标题显示的报表,但是网站的页面标题是可以重复的,所以无法“唯一标识”),我们根据URL地址来查看该页面的Pageviews、Unique Pageviews、Exit Rate等。但不知道大家有没有发现Google Analytics的Content模块下还有一张有趣的报表——Content Drilldown(内容下钻,关于下钻的概念可以参考文章——数据立方体与OLAP),这张报表中的Page列就像是一个树形结构可以不断地向下展开直到底层节点,其实在GA的其他报表上也有类似的下钻功能,比如Visitors—Browser Capabilities—Browsers这张报表也支持从浏览器类型到浏览器版本的下钻操作。

  也许你看了页面下钻的报表后,已经有点理解为什么URL的设计会对网站分析产生影响,下面就来看一下我的博客的实例:

  顶部导航中的“文章专题推荐”中分类罗列的一些相应的文章,并且在该页面下还根据文章分类设置了4个子页面:“电子商务分析”、“网站用户分析”、“用户体验分析”、“其他文章推荐”,URL也是按照页面的层次结构进行设计的,如下图:

GA-content-drilldown

  所以Google Analytics页面下钻的实现方式是将页面的URL根据”/”进行切分,从左向右分级存放,同时将下一层的数据向上汇总到上一层,这样报表上既可以查看每个页面的数据,也可以查看根据URL的结构向上逐层汇总的聚合数据。这对网站分析是十分有用的,因为我们同时获得了细分数据和汇总数据,从而可以从不同的数据粒度上进行分析。也许你会说不就是将同一类型的页面的数据加起来吗,在分析的时候自己加一下就行,也许上面例子中的2层并且只有4个子页面是很好处理,但如果网站页面超过3层,每层可能会有上百个子页面,那么如果没有这类下钻功能就会变得难以应付了。

  可能有的朋友会问,那有没有不通过URL来区分个页面类型和层级的?如果你是用第三方工具,就需要进行额外的设置来让网站分析工具可以识别和区分你的网站页面,比如在页面上加入Google Analytics的自定义参数(Custom Variables)区分页面类型,但是如果无法自动添加这类JS代码的话,那么对于一个页面繁多的网站这个工作量就会相当庞大。如果你用自己的分析工具或者基于网站数据仓库,也许你需要维护一张页面的维表,可以包括[页面ID,页面URL,页面描述,上级页面,页面层级]这些属性,从而建立起具有层级关系的页面结构树,当然如果你的网站时常变动,那么要维护这张维表也是一件十分头疼的事情。

  下面就以我的博客作为实例来说明下URL结构设计对于网站分析的影响是如何体现的。

我的博客的URL设计

  得益于Wordpress这个强大的开放内容管理系统,让博客的URL定制变得不再复杂。Wordpress的后台控制界面中提供了“固定链接设置”的功能,用户可以根据自己的需要设计适合自己网站的URL结构,比如我的博客的固定链接是/%category%/%postname%/,也就是/文章分类/文章名/,可以再来看一下我之前一篇文章——优化网站信息架构中的我画的Wordpress的简要信息架构图:

Wordpress-IA

  通过上图结合我的URL结构设置,可以理解为我将信息架构中的一个分支——分类目录——作为URL结构设计的主依据,这样做有什么好处?在GA的页面钻取的分析报告中我既可以查看每篇文章的数据,同时可以查看每个文章分类的汇总数据:

GA-category-drilldown

  图中左侧的数据对应我的博客侧边栏分类目录中每个分类的汇总数据,右侧的数据对应“网站定量分析(web-quantitative-analysis)”分类下面各文章的细分数据。同时,当用户使用博客侧边栏的各索引(根据分类目录、文章标签、日期归档)时,Wordpress也提供了非常友好的URL结构,比如分类目录用了/category/分类名、文章标签用了/tag/标签名、日期归档用了如/2010/09/这类年月的结构来罗列相应的文章列表,这样就可以在GA中同样可以使用跟上面一样的下钻来分析有多少用户试图使用这些功能来索引博客文章,并且查看了哪些分类、标签或者日期归档,有兴趣的朋友可以到自己的Google Analytics上面试试。

  这是我的博客的URL设计,每个网站可以根据自身的特点和需要设计适合自己的URL结构,从而有效地简化和提升网站分析中页面数据的细分和汇总。

总结

  层次清晰、结构规范的URL不但可以为网站分析节省更多的工作量,同时可以提高URL的可读性,有效地提升对搜索引擎的友好度,增加网站SEO的效果。而清晰的URL结构需要基于对网站信息架构的系统有效的梳理,一旦做好了这些,一定会让网站建设的各个方面都受益匪浅。

  需要注意的是,URL的设计和规则需要在网站开发阶段就进行明确定义,写入相关的设计规范和文档中,因为一旦网站上线后要想再对URL的结构进行调整将会是一件极度麻烦并且得不偿失的事情。

  中秋节在江南阴雨绵绵的天气中度过,接下来马上又是7天的长假,提前祝大家度过一个Happy的国庆假期!

让URL更适合分析》上有 28 条评论

  1. ZL

    深有同感。
    之前所在网站的url目录结构非常好,php建的,动态的内容只是增加id数字而已。那时候看ga基本只看内容细目,就能很好的统计到各个频道/目录的总体访问数据,很少看热门网页(虽然两者是一致的,目录结构好的话通过关键词筛选即可)。
    后来的公司网站的url还比较乱,ga中内容细目只作为摆设,很少去细分查询具体的页面(二级域名频道汇总还比较方便);当然,我们是自己采集数据来分析,查询的用url细分页面的时候很麻烦,只好配置对应的映射关系,多加一个page_id字段来区分,目前也还只对应了关键页面,其他的页面还需要慢慢的映射更新。
    用url区分的使用,遇到同一个地址对应了不同内容(不同步骤)时根本没法区分。要改url结构真不容易,开发部门无法通过。
    url的设计需要从网站整体来作信息架构才行。

    我们把记录的url分成 Host, path, query 三段。这样查询的时候还方便些。没有加page_id字段时,看之前同事作的page_id与url的映射关系相当复杂,简直也没法维护,也不想维护了。

    回复
  2. Pingback 引用通告: 9月26日 XJP新闻快评 - XJP的碎碎念

  3. joegh 文章作者

    @ZL: 感谢这么有经验的留言,当网站URL结构不清晰时,GA的Content Drilldown确实只能成为摆设;其实如果在网站建立后腰更改URL的设置是要下很大决心的,而建立URL与页面的映射关系是件非常痛苦的事,并且谁也不愿意去承担起这样的更新维护工作。

    回复
  4. Pingback 引用通告: 让URL更适合分析 « 网站优化

  5. Pingback 引用通告: 让URL更适合分析 | 站长资讯 · 站长学苑

  6. Pingback 引用通告: 让URL更适合分析 | Wang Jun's Blog

  7. Pingback 引用通告: 让URL更适合分析 | Wang Jun's Blog

  8. Pingback 引用通告: 让URL更适合分析 | Wang Jun's Blog

  9. Pingback 引用通告: 用户点击与网站目标 |转载文章 | 网站优化,互联网营销策划,数字电视运营

  10. Pingback 引用通告: 用户点击与网站目标 - 番茄运营

  11. Pingback 引用通告: 用户点击与网站目标 - IdeAsia.cn

  12. Pingback 引用通告: UEDBase | 用户为先·专注体验 » Blog Archive » 用户点击与网站目标

  13. Pingback 引用通告: 用户点击与网站目标 » 中国最专业权威网站流量统计服务商-PHPStat-普艾斯官方博客

  14. 5done

    楼主的文章很好。比较喜欢。 我看完后有个质疑。长的网址虽然便于网站数据分析。但是不便于搜索引擎收录。例如:
    /xxxxx/xxxxxxx/xxxxxxx-xxxxx-xxxx-xxxx.html
    类型虽然一目了然。但是收录起来好像不是那么好的。

    回复
  15. joegh 文章作者

    @5done: 从SEO的角度来看,如果目录层次过深,每层目录都在URL里面用全名体现确实不利于搜索引擎的优化,这个上次另外一个朋友也跟我谈到过,因为我对SEO并没有那么熟,所以可能会忽视这方面的影响。其实我们想要知道的是URL与内容或产品页面的对应关系,那么最简单的解决方案就是不要使用全称,用相应内容的ID或者简称,这样既可以将URL与内容对应起来,又有利于搜索引擎优化。

    回复
  16. Pingback 引用通告: 用戶點擊與網站目標-基於Google Analytics的應用 | A- to A+

  17. Pingback 引用通告: 网站分析:让URL更适合分析 | 199IT互联网TMT数据 | 中文互联网数据研究资讯中心-199IT

  18. Pingback 引用通告: 用户点击与网站目标_读懂_钛媒体网

  19. Pingback 引用通告: 用户点击与网站目标

多多秀 进行回复 取消回复

电子邮件地址不会被公开。 必填项已用 * 标注

您可以使用这些 HTML 标签和属性: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>