【深圳公牛通讯】搜索引擎优化如何分析网站日志
网站搜索引擎优化过程将不可避免地分析网站日志。网站日志的分析和诊断就像为网站看病一样。通过对网站日志的分析,我们可以更清楚地了解网站的健康状况,并且这些数据的使用更有利于网站搜索引擎优化。通过网站日志,您可以清楚地知道用户访问了您网站的哪个页面,以及在显示什么知识产权、什么时间、什么操作系统、什么浏览器和什么分辨率的条件下访问是否成功。对于从事搜索引擎优化的专业人士来说,网站日志可以记录蜘蛛机器人爬行各种搜索引擎网站的详细信息,如哪一天哪个IP百度蜘蛛机器人多次访问网站,访问了哪些页面,访问这些页面时返回的网页状态代码。
搜索引擎优化如何分析网站日志
一、网站日志的功能
1、通过网站日志可以了解蜘蛛对网站的基本爬行情况,可以知道蜘蛛的爬行轨迹和爬行量。
2.网站的更新频率也与网站日志中蜘蛛的爬行频率有关。一般来说,更新频率越高,蜘蛛爬行的频率越高。我们网站的更新不仅是新内容的添加,也是我们的微调操作。
3.根据网站日志的反应,我们可以对我们空间中的某些事情和问题给出预警,因为如果服务器出现问题,它将首先反映在网站日志中。我们应该知道服务器的稳定速度和打开速度都会直接影响我们的网站。
4.通过网站日志,我们可以知道哪些网页非常受蜘蛛欢迎,哪些网页甚至没有被蜘蛛接触过。同时,我们还可以发现一些蜘蛛由于过度爬行而消耗了我们服务器上的大量资源,所以我们不得不进行屏蔽工作。
二、如何下载网站日志
1.首先,我们的空间应该支持网站日志下载,这是非常重要的。购买空间时,必须事先知道是否支持日志下载,因为有些服务提供商不提供这种服务。如果支持,空间后台一般具有日志日志日志下载功能,可以下载到根目录,并通过FTP传输到本地。如果使用服务器,可以将其设置为将日志文件下载到指定路径。
三、网站日志数据分析
1.网站日志中的数据量太大,所以我们通常需要使用网站日志分析工具来查看它。117.26.203.167--[02/5/2011:01:57:44-0700MSIE 8.0Windows NT 5.1三叉戟/4.0;askTBCs-ST/5 . 11 . 3 . 15590;。净CLR 2 . 0 . 50727;Alexa工具栏)”
分析:
117.26.203.167访问知识产权;
2011年5月2日:01: 57: 44-0700访问日期-时区;
GET/index . PHphTp/1.1根据HTTP/1.1协议抓取(域名下)/index.php本页(GET表示服务器操作);
500服务器响应状态代码;
服务器响应状态代码通常有以下类型:200、301、302、304、404、500等。200表示用户已经成功获得所请求的文件。如果它是一个搜索引擎,它证明蜘蛛在这次爬行中成功地找到了一些新内容。301意味着用户访问的页面的url已经被重定向301(永久地)并且302被临时重定向。404意味着访问的页面不再存在,或者访问的url是错误的。500是服务器错误。
19967表示捕获了19967字节;
Mozilla/4.0(兼容;MSIE 8.0Windows NT 5.1三叉戟/4.0;askTBCs-ST/5 . 11 . 3 . 15590;。净CLR 2 . 0 . 50727;亚历山大工具栏(Alexa Toolbar)是指访问者在访问端使用火狐浏览器和Alexa Toolbar等信息;
2.如果日志中的格式不同,这意味着日志格式设置不同。
3.从许多日志中可以看出,200,000和200,064代表正常抓取。
4、捕捉频率是通过查看百度蜘蛛的每日捕捉次数日志获得的。没有捕获频率的标准时间表或频率编号。我们通常通过比较许多天的日志来判断它。当然,我们希望百度蜘蛛每天能捕捉尽可能多的次数。
5.有时,当我们的路径不一致时,有斜线和无斜线都有问题。蜘蛛会自动识别301以斜线跳转到页面。这里我们发现搜索引擎可以判断我们的目录,所以我们需要统一我们的目录。
6.我们已经分析日志很长时间了,我们可以看到蜘蛛的捕获规则。可以看到同一目录下单个文件的捕获频率间隔和不同目录的捕获频率间隔。这些捕捉频率间隔由蜘蛛根据网站权重和网站更新频率自动确定。
7.蜘蛛抓取我们的页面是根据它们的重量来分级的,一般顺序是主页、目录页和内页。
从网站日志中我们能知道什么?
1.我们购买的空间稳定吗?
2.蜘蛛比我们更喜欢哪一页?
3.蜘蛛什么时候经常爬我们的网站,我们什么时候需要更新内容