一起来了解下搜索引擎的索引系统

发布作者：admin

发布时间：15-10-23

一起来了解下搜索引擎的索引系统

众所周知，搜索引擎的主要工作过程包括：抓取、存储、页面分析、索引、检索等几个主要过程。现在我们一起来了解下索引系统。

在以亿为单位的网页库中查找特定的某些关键词犹如大海里面捞针，也许一定的时间内可以完成查找，但是用户等不起，从用户体验角度搜索引擎要在毫秒级别给予用户满意的结果，否则用户只能流失。怎样才能达到这种要求呢？

如果能知道用户查找的关键词（query切词后）都出现在哪些页面中，那么用户检索的处理过程即可以想象为包含了query中切词后不同部分的页面集合求交的过程，而检索即变成了页面名称之间的比较、求交。这样，在毫秒内以亿为单位的检索成为了可能。这就是通常所说的倒排索引及求交检索的过程。如下为建立倒排索引的基本过程：
百度索引系统

1，页面分析的过程实际上是将原始页面的不同部分进行识别并标记，例如：title、keywords、content、link、anchor、评论、其他非重要区域等等；

2，分词的过程实际上包括了切词分词同义词转换同义词替换等等，以对某页面title分词为例，得到的将是这样的数据：term文本、termid、词类、词性等等；

百度索引系统

3，之前的准备工作完成后，接下来即是建立倒排索引，形成{termàdoc}，上图即是索引系统中的倒排索引过程。

咨询请Q客服
请先发网站和关键词信息给客服

广州SEO公司
查看我们地址联系方式

案例
请点击这里查看

我们是立足于广州的专业SEO团队。因为专注，所以专业。本团队做SEO多年，擅长白帽SEO的技术，对各类型网站的SEO策略思维有自己的独到之处。

我们致力于解决目前一些企业网站花了钱建设的企业网站，但却没人管理、没流量的难题，我们能让网站活跃起来，让网站产生价值。我们能做的：可以做到增加网站收录、提升网站权重、提高网站在百度等搜索引擎上的排名与恢复被K或降权的网站。

栏目

最新文章

一起来了解下搜索引擎的索引系统

Share

关注微信

联系我们

栏目

最新文章

标签

一起来了解下搜索引擎的索引系统

Share

关注微信

联系我们