« 古籍的数量 | 首页 | 零编辑的娱乐新闻系统:牛啦网 »

搜索引擎的体系结构


搜索引擎按照功能可以分为如下几部分:

1. 巡视软件(robot/spider/crawler)

作用:自动从网上抓取信息。

2. 页面存储器

作用:将抓取回来的信息存储起来,也就是数据库。

3. 分析索引器

作用:对抓取回来的信息进行分析,建立索引。

4. 查询器

作用:根据用户的提问在索引库中进行查询,进行文档与提问相关性评价,并对将输出的结果进行排序。

在查询之前,查询器需要首先对用户输入的数据进行特征化表示,抽取其中的主题概念。

5. 用户接口

作用:提供用户与搜索引擎之间的界面,帮助用户更高效、更方便地使用搜索引擎查找信息。

具体而言,用户接口又分为三部分:(1)接受用户输入的提问;(2)将查询结果返回给用户;(3)提供用户相关反馈机制。

(完)

相关内容

随机文章

  • 2006.07.10: 英语地位的确立,中世纪
    (英语史系列笔记之四) 在系列笔记之三中,我们看到1066年法国的诺曼底公爵占领了不列颠岛,英国的国家机器都被法国人控制了。当时的情况是,法语是官方语言,英语成了二等语言,很有可能从此就消失了。在社会上层都讲法语和拉丁语的情况下,英语还能生存下来,并最终取代法语的位置,有这样几个原因:
  • 2006.12.03: 政府为谁服务?
    (经济学笔记之27) 在过去48小时中,接连有两篇报道,指出中国的地方政府对房价上涨负有直接责任。

功能链接

广告



我要发表看法