我认为搜索引擎的的各个部分都是非常重要的,缺一不可,但是搜索引擎算法是确保其他部分能够正常运行的关键。任何一个搜索引擎工作的方式都是以搜索算法为基础的,他和用户发现数据的方式息息相关。
算法是什么呢?作者认为它就是一个解决问题的过程:提出问题,然后找出可能的答案,在把答案反馈给问题的提出者,就相当于把含有搜索者搜索词语的页面返回给用户。
总体上来说搜索算法一般分为3大类:出站算法、整体算法、网页算法。
一、出站算法
网站外部内容与网站在搜索结果中的排名有什么关系?显而易见的就是入站链接,一个优质的入站链接是影响网页排名的出站因素。“优质”的入站链接是指用户愿意提供的入站链接,因为他们认为某网站提供的内容很有用。一个网站拥有良好的入站链接数目与访问者在网站上表现出来的信任程度成正比。
二、整体网站算法
整体网站算法观察的是网站上页面之间的关系。比如:主页面上的内容和其他页面的内容相关么?从用户角度出发,这是一个重要的因素,如果用户进入你的网站看见的内容与主题完全不相关,他们肯定会不高兴。
整体算法正是考察网站元素之间的相关性,比如网页的结构,锚文本,内部链接,相关文章等是如何串联在一起的。
网站的体系结构(用户如何根据标题使用网站)如何是用户决定网站是否有用的一个重要因素。SEO的决定性因素就是用户认为网站是否有用,所以作者认为应该从用户的角度出发,建立一个访问者希望花时间浏览的网站。这样的SEO肯定会自然的出现。
三、网页算法
考虑网页算法是观察用户是否觉得网页值得浏览,包括关键词在内容中如何使用、网页中的内容如何关联。例如:网站是做SEO的,那么网页算法就会确定术语为“SEO”的使用次数以及网页上相关短语和单词的次数(如:网站优化、SEO解答、SEO工具、百度SEO等)。
网页算法还会观察访问这看不到的一些因素。网页的后端包专门为爬虫设计的特殊内容,这些内容成为元标签(包括title,keywords,description标签等)。爬虫检查你的网站时候,会把这些元标签看作网站主题的定义。然后爬虫会根据网站优化的其他元素,以及整体网站优化和出站优化,为这些元标签确定权重。
原文出处:http://www.seoln.net/