今天长春SEO自学网站长和大家系统的介绍一下网站日志的相关知识,对于一个专业SEO优化人员,不会看日志,怎么敢说自己是优化师那?不会看服务器日志,也不用担心,看了今天长春SEO自学网站长的详解介绍,你就回了,来来一起走起吧,今天分享的内容一共包含五个部分:
一、什么是网站日志
网站日志是记录web服务器接收处理请求以及运行时错误等各种原始信息的以·log结尾的文件,确切的讲,应该是服务器日志。
网站日志最大的意义是记录网站运营中比如空间的运营情况,被访问请求的记录。通过网站日志可以清楚的得知用户在什么IP、什么时间、用什么操作系统、什么浏览器、什么分辨率显示器的情况下访问了你网站的哪个页面,是否访问成功。
二、如何查看网站日志
网站日志一般存放在虚拟主机的 logfiles 文件夹下,可以通过FTP工具将网站日志下载下来,下载下来的为log格式的文档,可通过txt文档方式查看。
如何查看自己的服务器的日记? (以Windows 2003系统为例)
1、开始--管理工具--事件查看器--系统 或者 控制面板--管理工具--事件查看器--系统。
2、在远程客户端,运行IE浏览器,在地址栏中输入“https://Win2003服务器IP地址:8098”,如“https://192.168.1.1:8098”。在弹出的登录对话框中输入管理员的用户名和密码,点击“确定”按钮即可登录Web访问接口管理界面。接着在“欢迎使用”界面中点击“维护”链接,切换到“维护”管理页面,然后点击“日志”链接,进入到日志管理页面。在日志管理页面中,管理员可以查看、下载或清除Windows 2003服务器日志。选择系统日志可进行查看。并且在日志管理页面中可列出Windows 2003服务器。如果你的服务器或者虚拟空间不知道怎样下载服务器日志,那么就联系长春SEO自学网站长吧,站长是个热心人,很愿意帮助你的。
三、网站日志的作用
通过网站日志可以清楚的得知访客和服务端等应用是否正常运行,或者存在哪些缺陷,失效组件等信息。
对于专业从事搜索引擎优化工作者而言,网站日志可以记录各搜索引擎蜘蛛机器人爬行网站的详细情况,例如:哪个IP的百度蜘蛛机器人在哪天访问了网站多少次,访问了哪些页面,以及访问页面时返回的HTTP状态码
四、如何分析网站日志
1、访问次数、停留时间、抓取量
从这三项数据中我们可以得知:平均每次抓取页面数、单页抓取停留时间和平均每次停留时间。
平均每次抓取页面数=总抓取量/访问次数
单页抓取停留=每次停留/每次抓取
2、平均每次停留时间=总停留时间/访问次数
从这些数据我们可以看出蜘蛛的活跃程度、亲和程度、抓取深度等,总访问次数、停留时间、抓取量越高、平均抓取页面、平均停留时间,表明网站越受搜索引擎喜欢。
而单页抓取停留时间表明网站页面访问速度,时间越长,表明网站访问速度越慢,对搜索引擎抓取收录较不利,我们应尽量提高网页加载速度,减少单而立停留时间,让爬虫资源更多的去抓取收录
五、网站日志语法结构
#Software: Microsoft Internet Information Services 6.0 #Software:表示软件名称
#Version: 1.0 #Version:表示版本号
#Date: 2013-03-13 00:05:17 #Date:表示时间
#Fields:说明如下#Fields: date time s-sitename s-IPcs-method cs-uri-stem cs-uri-query s-port cs-username c-IP cs(User-Agent) sc-status sc-substatus sc-win32-status sc-bytes cs-bytes time-taken
date:表示记录访问日期; 2013-03-13
00:05:17 time:访问具体时间
W3SVC212 s-sitename:表示你的虚拟主机的代称或机器码
116.255.196.2529s-IP:服务器IP
GET cs-method:表示访问方法或发生的请求/提交事件,常见的有两种:一个是GET,就是平常我们打开一个URL访问的动作,另一个是POST,提交表单时的动作
/xiaohuxingzhuangxiuxiaoguotu/218.html cs-uri-stem:用户在当前时间访问哪一个文件或具体页面
- cs-uri-query:是指访问地址的附带参数,如asp文件?后面的字符串id=12等等,如果没有参数则用“-”表示
80 s-port:访问的端口
- cs-username:访问者名称,如果没有参数则用“-”表示
218.30.103.86c-ip:访问者IP
Sogou+web+spider/4.0 cs(User-Agent):访问的搜索引擎和蜘蛛名称
200sc-status:HTTP状态码,200表示成功,403表示没有权限,404表示打不到该页面,500表示程序有错
0 子状态码 HTTP子协议的状态.一般来说网站都是不使用子协议的,所以这个代码为0就是很正常的
0 win32状态码是0,如果被64位系统访问,那么这里记录的就是64 sc-substatus:服务端传送到客户端的字节大小
12304 sc-bytes服务端传送到客户端的字节大小 服务器发送的字节数
256 cs-bytes客户端传送到服务端的字节大小 服务器接受的字节数
93 time-taken:time-taken处理时间(一段日志分析到此结束)
2013-03-13 00:12:37 W3SVC212 116.255.196.252 GET / - 80 - 220.181.108.99 Mozilla/5.0+(compatible;+Baiduspider/2.0;++ )
2013-03-13 00:12:37 W3SVC212 116.255.196.252 GET /index.html - 80 - 220.181.108.153 Mozilla/5.0+(compatible;+Baiduspider/2.0;++ )
HTTP状态码后面几位数据没有固定格式,如果只有一个表示下载数据字节大小;
2、HTTP状态码:
1**:请求收到,继续处理
2**:操作成功收到,分析、接受
3**:完成此请求必须进一步处理
4**:请求包含一个错误语法或不能完成
5**:服务器执行一个完全有效请求失败
长春网站优化_网站日志详解,日志如何分析 http://www.121seo.cn/mingci/364.html
以上文章出自长春SEO自学网未经作者许可,不得转载。2017-12-27 19:40:15"