基于用户访问情况,对网站和各种网络应用信息系统进行Web使用数据的统计分析,是任何一个运行成功网站和系统都必须去做的工作。Web使用数据的统计分析不但可以使得管理者对网站和系统的现有运行状况有一个了解,也是进行各种优化改造和发展规划的重要依据。
Web使用数据的统计分析,主要基于各种页面或功能的被访问记录,而页面的被访问记录则主要基于IP地址,被访问页面和页面的访问时间。
但是在记录过程中需要额外关注以下问题:
1,IP地址不能等同对应到一个用户
主要的问题是现在的很多用户使用的不是固定的IP,而是由Proxy Server动态分配的。这是一个很严重的问题。因为这样的话,就没有办法可以唯一标识一个用户。
目前通常采取的办法是,可以根据Cookies和规定单次访问时间来解决这个问题。根据Cookies可以唯一标识一个Session,规定访问时间可以依此判断用户是否为独立用户。虽然某些浏览器会禁用Cookies,但是允许Cookie的浏览器非常多,所以Cookies仍然是非常有用的数据。
2,计算用户页面驻留时间不准确
为了加快浏览速度,现在的浏览器一般会将访问过的页面进行缓存。这样就导致了当用户进行页面跳转的时候,服务器可能并不知道。
这个问题确实很难解决。一个解决的方案是提供特定的可以收集用户数据的浏览器。但是这是很难实现的。通常用户都不愿使用特定的浏览器,更不愿意被收集使用信息。
3,页面访问序列可能会有问题
还是由于浏览器缓存的问题,会导致记录页面访问序列有问题。这可以通过分析网站的结构信息(网站之间的链接关系)来进行初步判断筛选,从而可以得到部分的解决。
尽管有以上的问题,但页面访问记录仍然是非常有价值的。我们可以结合用户访问记录数据和网站站点数据一起来挖掘有用的信息,从而用来改进网站的结构,改善用户的体验并提高网站的性能。




