(简答题)
简单描述全文搜索引擎的工作原理及特点。
正确答案
全文检索是指计算机索引程序通过扫描文章中的每一个词,对每一个词建立一个索引,指明该词在文章中出现的次数和位置,当用户查询时,检索程序就根据事先建立的索引进行查找,并将查找的结果反馈给用户的检索方式。这个过程类似于通过字典中的检索字表查字的过程。全文搜索引擎的方法主要分为按字检索和按词检索两种。按字检索是指对文章中的每一个字都建立索引,检索时将词分解为字的组合。对于各种不同的语言而言,字有不同的含义,比如英文中字与词实际上是合一的,而中文中字与词有很大分别。按词检索指对文章中的词,即语义单位建立索引,检索时按词检索,并且可以处理同义项等。英文等西方文字由于按照空白切分词,因此实现上与按字处理类似,添加同义处理也很容易。中文等东方文字则需要切分字词,以达到按词索引的目的,关于这方面的问题,是当前全文检索技术尤其是中文全文检索技术中的难点。全文搜索引擎系统是按照全文检索理论建立起来的用于提供全文检索服务的软件系统。一般来说,全文检索需要具备建立索引和提供查询的基本功能,此外现代的全文检索系统还需要具有方便的用户接口、面向WWW的开发接口、二次应用开发接口等等。功能上,全文检索系统核心具有建立索引、处理查询返回结果集、增加索引、优化索引结构等功能,外围则由具有各种不同应用的功能组成。结构上,全文搜索引擎系统核心具有索引引擎、查询引擎、文本分析引擎、对外接口等等,加上各种外围应用系统等等共同构成了全文检索系统。最常用的全文搜索引擎有百度、谷歌(GooglE.等,与之相对应的是目录索引类搜索引擎。
答案解析
略
相似试题
(单选题)
关于使用全文搜索引擎进行信息查询的特点,描述正确的是()。
(单选题)
目前因特网上常用的搜索引擎有全文搜索引擎和()。
(简答题)
请阅读下列材料:有效获取信息(二)--从因特网获取信息主要内容:本节主要介绍常见搜索引擎:全文搜索引擎和目录索引类搜索引擎,搜索引擎获取网络信息检索的策略与技巧。要求学生学会使用搜索引擎来解决问题。教学对象:初中一年级学生(前面已学习相关信息与信息技术的概念)教学环境:多媒体网络教室,每位学生一台计算机根据上述材料,完成下列任务: (1)完成本节课的教材分析。 (2)设置合适的教与学活动。
(简答题)
简述全文检索的工作流程。
(简答题)
简述全文检索的工作流程。
(单选题)
下列对搜索引擎的描述错误的是()。
(简答题)
广度优先搜索与深度优先搜索各有什么特点?
(简答题)
简单描述分治法的基本思想。
(简答题)
简单描述回溯法基本思想。