在腾讯微博上面,robin主持了一个“百度说”http://t.qq.com/baidusays,里面有很多关于百度官方透露的一些实质性的消息和百度优化方面的一些技巧,整理一下,给大家看看,最好是每一条都看。
我是 Robin ,希望主持的这个“百度说”,能给大家有所帮助。
网站改版首先要考虑的如何保证老用户不流失,保证用户在访问他以前收藏的旧url时,能引导用户到新网站上对应的内容。我们推荐的做法是将旧url 301永久重定向到内容对应的新url,这样搜索引擎会把旧网页积累下来的权值完整的转移到新网页上。
淘客现在很泛滥,内容已经是高度重复,很多的类似网站将不会获得竞争优势。一般来说,内容高度重复的情况下,往往拼的是站点权重。搜索引擎的站点权重现在计算的都是各种途径的投票,不仅仅只有超链。百度通过一个叫做Baiduspider的程序抓取互联网上的网页,经过处理后建入索引中,目前Baiduspider只能读懂文本内容,flash、图片等非文本内容暂时不能处理。不少网站管理员反映百度对301重定向支持不彻底,新旧网页信息转换慢,这是事实。但是,请大家相信,百度在努力解决这个问题。
如果必须使用Flash等制作网页,建议制作一个供搜索引擎收录的文字版,并在首页使用文本链接指向文字版。如果百度竞价广告不继续投放,那该网站网页在百度中的自然排名是否有消极影响?回答见这里:http://tieba.baidu.com/club/9374916/p/5319324
百度的产品一直占据了很好的排名,真的优化的好?还是对自己做了特殊处理?具体回答见这里:http://tieba.baidu.com/club/9374916/p/5535955
已经强调过很多次了,百度site语法的结果数不准。而且这种不准的幅度甚至不是稳定的,可能今天比较接近真实值,明天就发生大波动了。site语法设定的初衷,其实是期望用户可以设定约束搜索范围,实现更加精准的搜索。这同intitle,inurl,本质上是相同的。而在这些高级语法下的结果数,和常规搜索一样,都是“估值”,而非精确值。因此,很有可能site下的“结果数”减少了,实际被索引数却可能增加了。
百度说:不要使用frame和iframe框架结构,通过iframe显示的内容可能会被百度丢弃。
重要的网页不要使用https协议,如果非用不可,尽量将首页和重要页面做个http版,方面百度收录。网页title是网页上主要内容的概括,搜索引擎可以通过网页标题迅速的判断网页的主题。每个网页的内容都是不同的,每个网页都应该有独一无二的title。
用户在百度网页搜索中搜索到你的网页时,title会做为最重要的内容显示在摘要中,一个主题明确的title会帮助用户更方便地从搜索结果中判断你网页上内容是否符合他需要。
通常网页标题可以这样描述
首页:网站名称 或者 网站名称_提供服务介绍or产品介绍
频道页:频道名称_网站名称
文章页:文章title_频道名称_网站名称
网页标题要主题明确,包含这个网页中最重要的内容;简明精练,不罗列与网页内容不相关的信息。网站改版,如果是内容发生根本性变化,则理论上会被视为一个全新网站,旧有超链失效。以前有商家在淘宝上用低价物品炒皇冠,炒成后再换其他高价值商品卖。这显然是一个漏洞。过期超链无效,本质上也是如此,这是合乎一般逻辑的。
有不少站长反映百度只收录不带www的URL,不收录带www的。或者两个都收录,即使从domain.com做了301转向到www.domain. c om也如此。搜索时,两个版本还可能同时出现在一个结果页面上。这应该是系统缺陷问题,不合逻辑。我们会反馈给相关工程师追查。
网页抓取和建立索引是不等同的。这些网页会经过一些必要的chk过程之后才会被建入索引。
百度对海外站点没有歧视。但百度从国内爬出去的蜘蛛,会严格遵守国家的政策和法令,所以国内普通用户访问受限的内容,百度蜘蛛一样会搞不定。任何对站点价值分析有贡献的要素,都有可能被搜索引擎使用。并且这些要素的使用方式,也不是一成不变的。至于具体有哪些要素已经被使用以及如何使用,这个无法详述。一个普通用户,如果用你的关键词去搜,怎样的结果是合理的?如果你不喜欢的结果,恰是用户所喜欢的,那么除非版权问题之类,否则很难得到解决;如果你不喜欢的结果,也是普通用户所不喜欢的,那么这是一个会被百度关注的问题。其实百度没啥神秘的,用这个逻辑可以解决一堆的猜想。
搜索引擎的技术思路都是一样的,找好内容的特征,把它们排上来,找不好内容的特征,把它们降下去。
现在网站被黑的问题,百度网页搜索工程师们也很头痛,平均每天会有几百个网站出现这种情况。我们正准备尝试着给域名的注册信箱发信通知,提醒一下站长,不知道有没有效果。我们也曾想在搜索结果里提示安全,也找过几家专业做安全的公司,但准确率和召回都很有问题。网站因作弊而被惩罚,百度会监控这些网站,修正了作弊内容,或者网站的质量指标达到某种层次,会降低惩罚力度,直至完全放开。也就是说,完全解除惩罚的消极结果还是有一个逐渐时间累积和行为改善的过程。如果网站改邪归正,百度会完全放开。
百度搜索框提示功能将向广大站长全面开放啦!!该功能的有效使用将帮助站长提升服务质量和用户黏性,进而获得更大的利益回报与成长空间。了解详情:http://tieba.baidu.com/club/9374916/p/5535955
百度暂时还没支持通过robots提交Sitemap。一般情况下,spider能处理大多数网站的数据抓取和更新,而无须借助sitemap。
Robots 掉的网页,如果互联网上其他网页链接并描述了这个网页的内容,我们会把这些描述信息建入索引,但 Robots 掉网页我们不会抓取,网页内容也不会收录。当你网站上的内容对用户有用时,用户会推荐给别人,推荐的形式可能多种多样:IM软件上推荐给自己的朋友、在论坛里发帖推荐、写博客介绍等。这些推荐,都会被搜索引擎用来判断网页/网站价值的高低。
不把 Meta Description 当做权值计算的因素,这个标签存在与否不影响网页权值,只是摘要的一个选择目标。
薛峰