什么是网站日志,怎么剖析SEO网站日志?
作为一名站长,假如连网站日志是什么都不知道,或许对其底子嗤之以鼻,我只能说你是一个不称职的网站站长,一旦网站出问题,必定是束手无策!即使把握了SEO基础知识也要长于剖析网站日志。
许多新手SEO站长或许觉得不去剖析网站日志也无关紧要,信任咱们都在自己的网站上安装了网站计算的代码,如Google analytics、量子计算、百度计算、cnzz、51.la等。这些东西能够计算网站的流量,可是这些计算东西都不能计算你主机上资源的原始拜访信息,例如某个图片被谁下载了,也不能计算到那些没有添加计算代码的当地,比方后台操作页面。
绝大多数收费主机都供给原始拜访日志,网站服务器会把每一个访客来访时的一些信息主动记载下来,保存在原始拜访日志文件中,假如你的主机不供给日志功用,主张你到期后仍是换主机吧。日志中记载了网站上一切资源的拜访信息,包含图片、CSS、JS、FLASH、HTML、MP3等一切网页翻开进程载入的资源,一起记载了这些资源都被谁拜访了、用什么来拜访以及拜访的成果是什么等等,能够说原始拜访日志记载了主机的一切资源运用状况。
剖析网站日志有什么效果?
1、咱们能够比较精确的定位查找引擎蜘蛛来匍匐咱们网站的次数,能够屏蔽伪蜘蛛(此类蜘蛛多以收集为主,会添加咱们服务器的开支);
2、经过剖析网站日志,咱们能够精确认位查找引擎蜘蛛匍匐的页面以及时刻长短,咱们能够顺次有针对性的对咱们的网站进行微调 ;
3、http回来状况码,查找引擎蜘蛛以及用户每拜访咱们的网站一次,服务器端都会发生相似301,404,200的状况吗,咱们能够参照此类信息,对咱们出现问题的网站进行简略的确诊,及时处理问题。
怎么剖析网站日志中的内容?
一、留意那些被频频拜访的资源
假如在日志中,你发现某个资源(网页、图片和mp3等)被人频频拜访,那你应该留意该资源被用于何处了!假如这些恳求的来历(Referer)不是你的网站或许为空,且状况码(Http Code)为200,阐明你的这些资源很或许被人盗链了,经过 Referer 你能够查出盗链者的网址,这或许便是你的网站流量暴增的原因,你应该做好防盗链了。
二、留意那些你网站上不存在资源的恳求
假如某些恳求信息不是本站的资源,Http Code不是403便是404,但从称号剖析,或许是保存数据库信息的文件,假如这些信息让他人拿走,那么进犯你的网站就轻松多了。建议这些恳求的意图无非便是扫描你的网站缝隙,经过漫无意图地扫描下载这些已知的缝隙文件,很或许会发现你的网站某个缝隙哦!经过调查,能够发现,这些恳求所运用的Agent差不多都是Mozilla/4.0、Mozilla/5.0或许libwww-perl/等等非常规的浏览器类型,以上我供给的日志格式化东西现已集成了对这些恳求的警报功用。咱们能够经过制止这些Agent的拜访,来到达避免被扫描的意图,具体方法下面再介绍。
三、调查查找引擎蜘蛛的来访状况
经过调查日志中的信息,你能够看出你的网站被蜘蛛拜访的频率,从而能够看出你的网站是否被查找引擎喜爱,这些都是SEO所关怀的问题吧。日志格式化东西现已集成了对查找引擎蜘蛛的提示功用。常见查找引擎的蜘蛛所运用的Agent列表如下:
Google蜘蛛 :Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
Baidu蜘蛛 :Baiduspider+(+http://www.baidu.com/search/spider.htm)
Yahoo!蜘蛛 :Mozilla/5.0 (compatible; Yahoo! Slurp/3.0; http://help.yahoo.com/help/us/ysearch/slurp)
Yahoo!我国蜘蛛 :Mozilla/5.0 (compatible; Yahoo! Slurp China; http://misc.yahoo.com.cn/help.html)
微软Bing蜘蛛 :msnbot/2.0b (+http://search.msn.com/msnbot.htm)
Google Adsense蜘蛛 :Mediapartners-Google
有道蜘蛛 :Mozilla/5.0 (compatible; YoudaoBot/1.0; http://www.youdao.com/help/webmaster/spider/)
Soso搜搜博客蜘蛛 :Sosoblogspider+(+http://help.soso.com/soso-blog-spider.htm)
Sogou搜狗蜘蛛 :Sogou web spider/4.0(+http://www.sogou.com/docs/help/webmasters.htm#07)
Twiceler爬虫程序 :Mozilla/5.0 (Twiceler-0.9 http://www.cuil.com/twiceler/robot.html)
Google图片查找蜘蛛 :Googlebot-Image/1.0
俄罗斯Yandex查找引擎蜘蛛 :Yandex/1.01.001 (compatible; Win16; I)
Alexa蜘蛛 :ia_archiver (+http://www.alexa.com/site/help/webmasters)
Feedsky蜘蛛 :Mozilla 5.0 (compatible; Feedsky crawler /1.0)
韩国Yeti蜘蛛:Yeti/1.0 (NHN Corp.; http://help.naver.com/robots/)
四、调查访客行为
经过检查格式化后的日志,能够检查盯梢某个IP在某个时刻段的一系列拜访行为,单个IP的拜访记载越多,阐明你的网站PV高,用户粘性好;假如单个IP的拜访记载希希,你应该考虑怎么将你的网站内容做得愈加吸引人了。经过剖析访客的行为,能够为你的网站建造供给有力的参阅,哪些内容好,哪些内容欠好,确认网站的发展方向;经过剖析访客的行为,看看他们都干了些什么事,能够推测访客的意图,及时揪出歹意用户。
总结:还有一点要介绍的是当网站遭受查找引擎K掉的时分,网站日志能够给咱们供给被K掉的原因(我是为站群的朋友考量),而且经过网站日志相关数据,能够看到网站什么时分查找引擎康复正常拜访,这样咱们能够挑选持续做或许抛弃,尽管很无法,但却也是不得已而又正确的挑选。