HTTP 404 错误意味着链接指向的网页不存在,即原始网页的URL失效,这种情况在所难免,一个优秀的404页面对于网站的重要性不言而喻,尤其网站大幅度改版时,大量链接失效,通过404页面可以引导流量,提高用户体验,然而作为虚拟主机用户,网站改版时不能合理地使用404页面,反而会造成大量重复页面,降低自身网站的权重。
何故?笔者借前段时间所改版,谈谈自己的疏忽。由于该网站原来的结构不是太合理,笔者对此前的网站进行了大幅度改版,对网站所有的栏目进行了重新架构,因而原来搜索引擎所收录的几千条记录的链接全部失效,为引导流量,我通过虚拟主机商提供的控制面板设置了一个404页面,页面中进行了错误提示并提供了网站首页链接、重要栏目链接和全站搜索框,然而不久我就发现了问题,google收录里面出现了大量的重复页面如:
查看服务器日志才发现蜘蛛爬取老页面地址时,记录如下:
2011-02-15 06:13:15 W3SVC9943750 222.191.251.114 GET /Literature/Xinwen/946_2.html - 80 - 123.125.71.83 Baiduspider+(+http://www.baidu.com/search/spider.htm) 200 0 0 2450 |
所有的返回状态码都是200 0 0,而不是404状态,200状态码即告诉蜘蛛此页面仍存在,可抓取,而大量的抓取同一页面造成大量的页面重复,搜索引擎对该网站的信任指数Trust Rank大幅降低,因而网站被降权,因此我果断地将404页面去除,至此页面收录基本正常。
一个正确设置的404页面,不仅应当正确地显示,同时,应该能够正确返回“404”错误代码,而不是200或302状态码。由于大部分虚拟主机设置的404页面都是返回200状态,且用户是无法更改服务器返回状态的,因而作为虚拟主机用户,在网站改版时造成大量的失效页面时,宁愿不设置404页面,也不能设置错误的404页面。此外,使用Meta Refresh来处理404错误页面,将404页面自动跳转到首页或者网站其他页面的做法也很不可取,极有可能产生200或者302状态码,如自动跳转至首页极有可能导致首页降权甚至消失。
如果你不知道你的网站返回的是404状态码,还是200、302或者其他状态码,可查看网站日志或者Server Header工具进行检查。
本文首发中国站长网,转载请注明来自:维普论文网(http://www.viplunwen.com)
感谢 维普论文 的投稿