欢迎您光临本站,如有问题请及时联系我们。唯一指定客服QQ:2745372750

网站SEO:网站日志深入篇

    热度:℃      作者:互联网

上一次在《网站日志在SEO中担任着怎样的角色?》,作者简单介绍了seo工作中网站日志的简单查看,提到了日志的重要性。其实在我看来,网站日志里呈现的每一条记录与其说是痕迹,不如说是镜像。上次作者提到了一个很重要的点,很多人很容易陷入,就是百度蜘蛛是先进入你的网站,然后检查内容质量,而不是先了解内容质量再决定用什么IP。很多读者对此不屑一顾。今天,作者将向您展示证据。

请看上面用红笔圈出的部分。同一个页面一天爬两次。这两个国际伙伴是220.181.108.97和123.125.71.49。很容易看出,这两个IP是一个提权的蜘蛛,一个垃圾内容的蜘蛛。我当天就爬上了你的网站。对于那些说第二天会在网上收录的人,我会告诉你,我今天在百度进入文章网站,那个页面还没有收录。请问是否同意第二天收录?

同时,作者还发现了一个非常有趣的现象:百度蜘蛛一般每一页只爬两次,第一次永远是一只提力蜘蛛

作者对上述现象的解释是:百度蜘蛛抓取网站内容,一开始应该是220.181.108。*,百度在抓取每一个新页面的时候都会使用提权蜘蛛,然后将提取的内容返回到数据库进行比对,从而确定蜘蛛第二次抓取你网站的IP。也就是说所谓的220.181.108。*对于第二个IP,每隔一天包含已爬网的网页。

很多时候,我们可能忽略或神话网站日志的功能。其实在我看来,网站日志的主要作用在于引导。

指导的第一个内容。123.125.71的IP时要警惕。*出现在我们网站的页面上。对于这样的页面,我们应该检查一下这个页面的内容是抄袭还是垃圾。对于123.125.68和220.181.51的IP。*,我们应该理解为百度蜘蛛对你网站的警告。对于这些情况,我们应该尽快纠正相应的页面。很多时候,我们的蜘蛛访问一个网站,会返回301,304,403,404等代码。我们必须及时处理它们。

第二外链指南。很多时候,我们在分发的时候可能并不知道什么样的外链是有效的,什么是高质量的,什么是垃圾。这是一个很难确定标准的事情。但是我们可以在网站日志里看到一些线索。比如上次文章里提到的作者,每条记录都有出处。通过入口的来源,我们可以通过这个记录找到百度在哪里进入你的网站。或者很多有思想的人会发现,我们发出的外部链接,我们给出的链接是不一样的。如下图:

这是作者的一个实验站。9月10日,作者在大型平台上发布了大量的产品和新闻页面,第二天的日志记录显示这些页面被蜘蛛浏览过。而且那个平台是不能拿的,所以作者发的链接都是没有www的链接,作者可以在返回值里看到很多蜘蛛抓取页面而不是有www的链接。所以笔者把这个平台理解为一个优质或者高效的平台。

第三,综合引导。经常可以在日志中找到一些返回值不是200的条目,通过日志的返回值可以很容易的找到这个页面,修改这个页面的错误或者不足。通过对比网站的每日日志,我们可以发现每天来网站的蜘蛛数量是增加了还是减少了。如果加上,是某个友好IP还是坏IP,这些记录是从哪个入口进入的?以便分析我们在日常网站搜索引擎优化工作中做得好和做得不好的地方。

当然日志有很多功能,我相信它给每一个站长带来的信息更多,作者只是一个肤浅的研究者。在这里,我给每一个站长一个建议:每天第一件事就是查看你昨天的工作记录,然后和网站日志对比,找出你工作中的好与坏。在笔者看来,保证网站关键词排名第一并非不可能,只是官方说法。只要做好网站优化,第一件事只是迟早的事。至少每个站长都要有一颗初心。

专攻网络运营6年,研究过企业网站和平台网站的优化。现在温州一家网络公司的首席优化员

来源:本文由互联网原创撰写,欢迎分享本文,转载请保留出处和链接!部分信息来源互联网,如有侵权,请联系删除。