搜索引擎的体系结构

作者: 阮一峰

日期: 2007年4月 3日

搜索引擎按照功能可以分为如下几部分:

1. 巡视软件(robot/spider/crawler)

作用:自动从网上抓取信息。

2. 页面存储器

作用:将抓取回来的信息存储起来,也就是数据库。

3. 分析索引器

作用:对抓取回来的信息进行分析,建立索引。

4. 查询器

作用:根据用户的提问在索引库中进行查询,进行文档与提问相关性评价,并对将输出的结果进行排序。

在查询之前,查询器需要首先对用户输入的数据进行特征化表示,抽取其中的主题概念。

5. 用户接口

作用:提供用户与搜索引擎之间的界面,帮助用户更高效、更方便地使用搜索引擎查找信息。

具体而言,用户接口又分为三部分:(1)接受用户输入的提问;(2)将查询结果返回给用户;(3)提供用户相关反馈机制。

(完)

留言(1条)

能不能再稍微展开一些

我要发表看法

«-必填

«-必填,不公开

«-我信任你,不会填写广告链接