网站分析工具四种数据收集方法及其优劣

网站分析工具收集数据的方法是多种多样的,有四种常用的方法。分别是:APACHE日志方法、网络信标方法、Apache模块方法、包嗅探方法。

一 Apache日志方法

Apache日志方法是最古老的数据收集方法。工作方式如下图。

Apache日志方法可以获取网页页面外信息(图片、视频的请求信息),还可以获得爬虫的信息,这是它的优势所在。但由于其要读取日志文件,比较费时,同时需要对服务器有控制权,因此不适合一般的网站(如虚拟主机站点等)。Apache日志方法不适用于日常分析,适当了解就好。

Apache日志方法

肖运华提示:如果想获得网站的爬虫信息,可以使用站长工具,如百度站长平台。

二 网络信标(页面嵌入代码)方法

这是现阶段主流的方法。网络信标方法是指在网站页面中嵌入测量用的图像(如百度统计、CNZZ、GOOGLE ANALYTICS等分析工具提供的代码,通常是带有一个1*1像素小图片,这个用于统计的图像称为信标)和标记代码(一段JAVASCRIPT代码)。当用户浏览该页面时,就向专用的服务器发送图像请求来获取访问者信息。如下图所示。

网络信标(页面嵌入代码)方法

只要把统计代码放在网页中,就可以收集数据,因此采用网络信标方法收集数据的网站分析是首选。其不足之处是数据收集基于JAVASCRIPT和COOKIE,如果用户禁用了javascript和COOKIE(可通过浏览器的自定义设置来禁止),就会失效。可喜的是,在中国,由于网民或网络环境对于个人信息的不敏感,这不会成为什么障碍。另外,网络信标方法不能获取爬虫信息,不过这没关系,还有前面我说过的站长工具嘛。

有些手机端网站对于JAVASCRIPT的执行,给以限制,那就得另找其他方法。

三 Apahce模块方法

又是得依赖于Apache服务器的一种方法。Apahce模块方法是指在APACHE服务器上安装当访问发生时,可以通过自动重写HTML代码来追加IMG标记的模块,进而收集数据的方法。

Apahce模块方法

对于javascript无法执行的环境,可以使用此方法。Apahce模块方法被用于SiteCatalyst(mobile)等移动网站分析工具中。

Apahce模块方法优点自不必说,缺点则是安装需要专业人士来操作,而且必须得有服务器管理权限。

四 包嗅探方法

包嗅探方法适合于精通网络的专业人士,或拥有这些人员的高流量网站。包嗅探方法是指用专用的服务器(称为包嗅探服务器)复制访问网站时产生的数据包(信息),并将信息发送到统计服务器进行统计的方法。

包嗅探方法

包嗅探方法可以说有“三高”:

  1. 高成本(服务器很贵)
  2. 专业程度高 (实施运维需要专业人员)
  3. 高端友好的数据统计方法(对于网站内容或WEB服务器不会造成不良影响,如延缓网页加载)

以上四个网站分析工具数据收集方法,各有其优劣。一般而言,或面对现实环境,大多使用基于网络信标方法的网站分析工具来进行网站分析,因为这是可实施且快捷方便的。如果网站规模大,或移动网站环境对JAVASCRIPT有限制,可以用其他更匹配的方法或更高端的工具。

肖运华提示:当你碰到一个新的网站分析工具时,你首先要去了解下其收集数据的方式方法。

相关文章

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注