451站长网

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 8919|回复: 19

如何读网站日志文件

  [复制链接]
发表于 2013-11-2 10:54:54 | 显示全部楼层 |阅读模式

如何读网站日志文件

如何读网站日志文件


如何读网站日志文件

    大部分情况下,流量分析要借助于流量分析软件,但直接读网站日志还是站长及SEO的基本功之一
    那怎么读日志文件呢:

    网站服务器会把每一个访问信息、每一个服务器动作、每一个文件调用自动记录下来,存在服务器原始日志文件中,所以,日志中的信息是相对准确、全面的。有些SEO需要知道的信息在流量分析软件中很少支持,必须直接查看日志,如服务器返回的状态码。

    原始日志就是一个纯文本文件,只要用文字编辑软件如WordpadNotepad打开就可以。一般主机商会在控制面板提供日志文件下载。
    下面是从我的451SEO学院201310月日志文件中随机选取的一行,我们来看一下它包括哪些信息:

  1. 121.11.255.42 - - [31/Aug/2013:16:23:15 +0800] “GET /seo/ HTTP/1.1”
  2. 200 52778 “http://www.baidu.com/s?wd=451seo”  “Mozilla/4.0 (compatible; MSIE  6.0;  Windows  NT  5.1;  SV1;  360SE)”
复制代码

    我们就来详细分析下上面这段日志的意思。
    121.11.255.42  这个代表用户IP地址
    指的是访问用户所在的,显示出访问的人来自什么地理位置。IP地址信息服务查一下这个IP所属位置,可以看到这位访客来自广东(如下图所示)

查询IP地址

查询IP地址



    31/Aug/2013:16:23:15  这个代表日期/时间
    这是文件被访问的准确时间。IP地址想结合起来,查看多条日志记录就可以跟踪某一个特定的用户从一个网页到另一个网页的访问顺序和在网站上的活动。

    +0800  这个代表时区
    相对格林威治时间的时区差。中国、新加坡处于东8区。

    “GET /seo/ HTTP/1.1”   这个代表服务器动作
    服务器要做的动作要么是GET,要么是POST。除了一些CGI脚本外,通常都应该是GET,也就是从服务器上获取某个文件,可以是HTML、图片、CSS等。
    例子里的这段记录的意思就是,按HTTP/1.1协议获取URL/seo/处的文件。这里的URL是相对地址,已经省去了域名部分,所以/seo/指的是451SEO学院首页:http://www.451.cc/seo

    200  这个代表服务器状态码
    服务器状态码200是指成功获取了文件,一切正常。如果返回是404,就是代表文件不存在/没有找到,网站里面如果404页面多了对我们网站影响是非常大的。其他常见状态码包括:
    301——永久转向。
    302——暂时转向。
    304——文件未改变,客户端缓冲版本还可以继续使用。
    400——非法请求。
    401——访问被拒绝,需要用户名、密码。
    403——禁止访问。
    500——服务器内部错误,通常是程序有问题。
    503——服务器没有应答,如负载多大等。

    52778  这个代表文件大小
    指的是获取文件的大小,例子中的是52 778字节。

    http://www.baidu.com/s?wd=451seo”  这个代表来路
    显示访问者是从哪里来到当前网页,也就是来到这个网页之前访问的那个网页URL来路可能是同一个网站的其他页(用户通过点击网站内部链接浏览),有可能是其他网站(用户通过其他网站上的链接点击过来),也有可能是搜索引擎的结果页面,如上面所示的例子。
    来路是搜索引擎结果页面时,URL中含有一个对seo意义重大的信息,就是用户搜索的关键词。例子里的来路是百度搜索,搜索关键词是“451seo”。

    “Mozilla/4.0 (compatible; MSIE  6.0;  Windows  NT  5.1;  SV1;  360SE)”  这个代表浏览器类型(User Agent
    最后一段显示的是浏览器和用户计算机的一些信息。
    例子中这段信息表示用户使用的是:
    与Netscapa兼容的Mozilla浏览器。实际上大部分浏览器User Agent都使用Mozilla/外开头,所以并不能区分浏览器。
    浏览器是IE6.0,或IE6.0为内核。
    Wingows NT操作系统。
    360浏览器(360浏览器是以IE6为内核的)。
搜索引擎蜘蛛就相当于一个浏览器,前面教程中提到的搜索引擎蜘蛛用于表明身份的用户代理就是这段信息。如百度蜘蛛如下表明自己:

日志是网站访问的最真实记录。分析用户访问时还可以借助一些流量分析工具,但检查某些问题,如访问错误、蜘蛛爬行情况等,非依靠原始日志不可。大中型网站日志文件可能很大,完整人工查看是不可能的,SEO部门可以开发出专用日志分析工具。

总结:看网站日志文件应该是我们站长或SEO从业人员必须要学会的。这篇文章写的很详细了,大家可以拿这个去参照下你网站里面的日志文件,多看多对也就会了。

作者:admin @ 451站长论坛  修订1.2  2013-11-2
451站长论坛,中国SEO专业教程发布区。本文版权所有,转载请注明出处。
如需了解更多SEO信息,请访问SEO教程专区->SEO基础教程专栏

评分

参与人数 1水表 +2 收起 理由
z19890919 + 2 不错,,说的很好。。前来支持下

查看全部评分

我爱我家(www.451.cc)

275

主题

540

水表

4264

积分

版主

Rank: 7Rank: 7Rank: 7

积分
4264

451版主勋章

发表于 2013-11-2 14:28:25 | 显示全部楼层
不错,说的很好

275

主题

540

水表

4264

积分

版主

Rank: 7Rank: 7Rank: 7

积分
4264

451版主勋章

发表于 2013-11-2 14:29:38 | 显示全部楼层
对这样读日志文件讲得很详细了

133

主题

652

水表

3856

积分

版主

Rank: 7Rank: 7Rank: 7

积分
3856
发表于 2013-11-3 00:55:29 | 显示全部楼层
正需要这个,谢谢分享,支持一下
3633笑话网(http://www.3633.cc),让你开心每一天!!

133

主题

652

水表

3856

积分

版主

Rank: 7Rank: 7Rank: 7

积分
3856
发表于 2013-11-3 00:56:50 | 显示全部楼层
看看,学习下
3633笑话网(http://www.3633.cc),让你开心每一天!!

133

主题

652

水表

3856

积分

版主

Rank: 7Rank: 7Rank: 7

积分
3856
发表于 2013-11-3 01:00:03 | 显示全部楼层
谢谢站长,看了你这篇教程知道怎么查看百度什么时候来到我网站了,
3633笑话网(http://www.3633.cc),让你开心每一天!!
发表于 2013-11-3 09:41:27 | 显示全部楼层
不错,,说的很好。。前来支持下

7

主题

57

水表

453

积分

版主

Rank: 7Rank: 7Rank: 7

积分
453
发表于 2013-11-4 10:17:53 | 显示全部楼层
看看。。学习下
发表于 2013-11-10 12:19:50 | 显示全部楼层
我的网站没有权限查看怎么办
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|广告合作|小黑屋|451站长网 ( 粤ICP备13060624号-1 )

GMT+8, 2018-5-28 17:45 , Processed in 0.209962 second(s), 46 queries .

Powered by 451 X3

© 2001-2013 站长论坛.

快速回复 返回顶部 返回列表