今天红帽SEO来给大家讲一些搜索引擎的共工作原理,文采不好,大家多多包涵
搜索引擎工作过程非常复杂,大体上可以分为三个阶段
A.爬行和抓取:
蜘蛛爬行,抓取,跟踪链接,吸引蜘蛛,爬行时的复制内容检测
B.预处理:
提取文字,中文分词,去停止词,消除噪声,去重,正向索引,倒排索引,链接关系计算,特殊文件处理
C.排名:
搜索词处理,文件匹配,初始子集的选择,相关性计算,排名过滤及调整,排名显示,搜索缓存,查询及点击日志
SEO基础知识:搜索引擎的工作原理简析
搜索引擎优化(SEO)的主要任务之一就是提高网站的搜索引擎友好性。而搜索引擎优化的每个环节都与搜索引擎存在必然的联系,研究搜索引擎优化实际上是对搜索引擎工作过程的逆向推理。因此,学习搜索引擎优化应该从最基本的搜索引擎的工作原理开始。
搜索引擎的主要工作包括:页面收录、页面分析、页面排序及关键词查询。
1.页面收录
页面收录指搜索引擎通过蜘蛛程序在互联网上面抓取页面进行储存的过程,它为搜索引擎开展各项工作提供数据支持。
2.页面分析
搜索引擎首先对原始页面建立索引,实现对页面的快速定位,然后提取页面的正文信息,并对正文信息进行且次已经这些词建立索引,从而得到页面与关键词的对应关系,最后搜索引擎对关键词进行重组,并建立关键词与页面间对关系的反向所以列表,从而能够根据关键词快速定位至相应的页面。
3.页面排序
搜索引擎结合页面的内外部因素计算出页面与某个关键词的相应程度,从而得到与该关键词相关的页面排序列表。
4.关键词查询
搜索引擎接受来自用户的查询请求,并对查询信息进行切词及匹配后,再想用户返回相应的页面排序列表。
以上是基本的搜索引擎工作原理,相信对大家学习SEO会有一定的帮助
本文由上海红帽SEO团队提供http://www.hm-seo.com/index.php/seo_jichu/283.html
