苏宁

携程

微博

爱奇艺

腾讯视频

QQ音乐

当当

天猫

腾讯会议

阿里健康大药房

搜索引擎的基本结构搜索引擎的主要模块及功能

摘要：搜索引擎是将与用户检索内容相关的信息展示给用户的系统，是一项检索服务，是根据一定的策略，用特定的计算机程序，从网上搜集、整理信息并呈现给用户。搜索引擎技术的核心模块一般包括爬虫、索引、检索和排序等，同时可添加其他一系列辅助模块，以为用户创造更好的网络使用环境。下面来了解下搜索引擎的基本结构及模块功能。

一、搜索引擎的基本结构

搜索引擎基本结构一般包括：搜索器、索引器、检索器、用户接口等四个功能模块。

1、搜索器

搜索器也叫网络蜘蛛，是搜索引擎用来爬行和抓取网页的一个自动程序，在系统后台不停歇地在互联网各个节点爬行，在爬行过程中尽可能快的发现和抓取网页。

2、索引器

它的主要功能是理解搜索器所采集的网页信息，并从中抽取索引项。

3、检索器

其功能是快速查找文档，进行文档与查询的相关度评价，对要输出的结果进行排序。

4、用户接口

它为用户提供可视化的查询输入和结果输出的界面。

二、搜索引擎的主要模块及功能

1、爬虫：从互联网爬取原始网页数据，存储于文档知识库服务器。

2、文档知识库服务器：存储原始网页数据，通常是分布式Key-Value数据库，能根据URL/UID快速获取网页内容。

3、索引：读取原始网页数据，解析网页，抽取有效字段，生成索引数据。索引数据的生成方式通常是增量的，分块/分片的，并会进行索引合并、优化和删除。生成的索引数据通常包括：字典数据、倒排表、正排表、文档属性等。生成的索引存储于索引服务器。

4、索引服务器：存储索引数据，主要是倒排表，通常是分块、分片存储，并支持增量更新和删除。数据内容量非常大时，还根据类别、主题、时间、网页质量划分数据分区和分布，更好地服务在线查询。

5、检索：读取倒排表索引，响应前端查询请求，返回相关文档列表数据。

6、排序：对检索器返回的文档列表进行排序，基于文档和查询的相关性、文档的链接权重等属性。

7、链接分析：收集各网页的链接数据和锚文本（Anchor Text），以此计算各网页链接评分，最终会作为网页属性参与返回结果排序。

8、网页去重：提取各网页的相关特征属性，计算相似网页组，提供离线索引和在线查询的去重服务。

9、网页反垃圾：收集各网页和网站历史信息，提取垃圾网页特征，从而对在线索引中的网页进行判定，去除垃圾网页。

10、查询分析：分析用户查询，生成结构化查询请求，指派到相应的类别、主题数据服务器进行查询。

11、页面描述/摘要：为检索和排序完成的网页列表提供相应的描述和摘要。

12、前端：接受用户请求，分发至相应服务器，返回查询结果。

标签： 搜索引擎网络互联网 APP/网站/基础软件

关联文章推荐

1 搜索引擎和浏览器的区别搜索引擎和数据库的区别

网站提醒和声明

本站为注册用户提供信息存储空间服务，非“MAIGOO编辑”、“MAIGOO榜单研究员”、“MAIGOO文章编辑员”上传提供的文章/文字均是注册用户自主发布上传，不代表本站观点，版权归原作者所有，如有侵权、虚假信息、错误信息或任何问题，请及时联系我们，我们将在第一时间删除或更正。申请删除>> 纠错>> 投诉侵权>> 网页上相关信息的知识产权归网站方所有(包括但不限于文字、图片、图表、著作权、商标权、为用户提供的商业信息等)，非经许可不得抄袭或使用。

提交说明：快速提交发布>> 查看提交帮助>> 注册登录>>

踩

相关推荐

什么是搜索引擎搜索引擎的工作原理

在互联网时代，我们应该都用过搜索引擎查询过一些信息。说到搜索引擎，我们脑海里想到的无非就是百度、谷歌、搜狗等等。搜索引擎这个名字也许我们并不陌生，但至于什么是搜索引擎也许大家并不怎么了解。下面小编就来介绍搜索引擎的含义及搜索引擎的工作原理。

搜索引擎网络

988 2

什么是搜索引擎优化 seo搜索引擎优化的优势有哪些

什么是搜索引擎优化？搜索引擎优化是网络营销的重要组成部分，它是基于搜索引擎排名规律合理优化企业网站，目的是使网站在行业中占据先进地位，从而提高品牌收入。seo搜索引擎优化的优势有哪些？下面随小编来了解下搜索引擎优化的相关知识吧。

搜索引擎 SEO

344 3

搜索引擎的基本结构搜索引擎的主要模块及功能

搜索引擎是将与用户检索内容相关的信息展示给用户的系统，是一项检索服务，是根据一定的策略，用特定的计算机程序，从网上搜集、整理信息并呈现给用户。搜索引擎技术的核心模块一般包括爬虫、索引、检索和排序等，同时可添加其他一系列辅助模块，以为用户创造更好的网络使用环境。下面来了解下搜索引擎的基本结构及模块功能。

搜索引擎网络

4401 5

谷歌浏览器怎么截图谷歌浏览器怎么设置主页

谷歌浏览器是一款简单快捷，非常方便的浏览器，也是我们常用的浏览器之一。我们在使用谷歌浏览器的过程中，可能会遇到一些问题，比如想要截图，或者设置主页，那么下面就为大家介绍谷歌浏览器怎么截图，谷歌浏览器怎么设置主页。

浏览器互联网

522 35

搜索网站打不开怎么办打开网站提示无法访问该网页是怎么回事

我们在浏览某个网站的时候发现这个网站打不开，可是用其它电脑却又可以轻松地打开，这是为什么呢？搜索网站打不开怎么办？有时候打开网站提示无法访问该网页又是怎么回事？网站，网页打不开的原因很多，可能来自你的网络设置，也可能来自服务器端。或者来自网站本身的问题。下面小编就来介绍网站网页打不开的原因及解决办法。

搜索引擎互联网

5553 3