永发信息网

信息检索的原理是什么

答案:1  悬赏:30  手机版
解决时间 2021-02-20 19:07
信息检索的原理是什么
最佳答案
问题一:信息检索的基本原理 10、文献检索的基本原理 2004-9-15
信息检索的基本原理是:通过对大量的、分散无序的文献信息进行搜集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效地获得和利用信息源。其中存储是为了检索,而检索又必须先进行存储。 详细内容 相关文献
www.chinalibs.net/zhaiyao.asp?titleid=46093问题二:简述信息检索的基本原理 信息检索(信息检索),是指按照一定的方式组织信息,并确定根据用户的工艺和技术的信息需求的相关信息。信息检索是信息检索过程的后半部分窄,即找到处理从收集的信息所需的信息,也就是我们常说的信息检索(信息检索信息或寻求)。问题三:文献信息检索的原理是什么 信息检索是指将信息按一定方式组织和储存起来,并针对信息用户的特定需求查找出所需信息内容的过程。
计算机信息检索是指利用一定的检索算法, 借助于特定的检索工具, 并针对用户的检索需求, 从非结构处的数据中获取有用信息的过程
信息检索原理示意图:如图
信息检索的实质是信息用户的需求和一定的信息集合的比较和选择的过程,即匹配的过程。
信息检索步骤
分析检索课题,明确检索要求
选择检索工具,选择检索途径
确定检索标识,确定检索运算
构筑检索提问,实施检索操作
获取初步信息,调整检索策略
获得满意结果问题四:文献检索的基本原理 文献检索的全过程由文献存储与文献检索构成。文献存贮是文献管理者把一定数量提示文献特征的信息或从文献中桥出的知识信息加以组织,编制成为检索工具或组织成检索系统,即编制检索工具和建立检索系统的过程。存贮是进行检索的前提,也是检索的基础。文献检索是检索者根据需要,从某—检索工具或检索系统中把相关的文献线索或知识信息查找出来。即利用检索工具和检索系统检索所需文献的过程。问题五:文献信息检索的原理是什么 文献检索的基本原理信息检索的基本原理是:通过对大量的、分散无序的文献信息进行搜集、加工、组织、存储,建立各种各样的检索系统,并通过一定的方法和手段使存储与检索这两个过程所采用的特征标识达到一致,以便有效地获得和利用信息源。其中存储是为了检索,而检索又必须先进行存储.问题六:简述计算机检索的基本原理? 从硬盘中读取你电脑启动需要的基本参数主要起自检的作用现在很多笔记本电脑取消了自检
希望采纳问题七:全文搜索引擎一般采用什么原理来采集信息 搜索引擎工作原理:发现网页-蜘蛛捉爬取-建立数据库-展现等循环工作问题八:搜索引擎的工作原理是什么? 搜索引擎的工作原理包括如下三个过程:首先在互联中发现、搜集网页信息;同时对信息进行提取和组织建立索引库;再由检索器根郸用户输入的查询关键字,在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并将查询结果返回给用户。
1、抓取网页。每个独立的搜索引擎都有自己的网页抓取程序(spider)。Spider顺着网页中的超链接,连续地抓取网页。被抓取的网页被称之为网页快照。由于互联网中超链接的应用很普遍,理论上,从一定范围的网页出发,就能搜集到绝大多数的网页。
发现、抓取网页信息需要有高性能的“网络蜘蛛”程序(Spider)去自动地在互联网中搜索信息。一个典型的网络蜘蛛工作的方式,是查看一个页面,并从中找到相关信息,然后它再从该页面的所有链接中出发,继续寻找相关的信息,以此类推,直至穷尽。网络蜘蛛要求能够快速、全面。网络蜘蛛为实现其快速地浏览整个互联网,通常在技术上采用抢先式多线程技术实现在网上聚集信息。通过抢先式多线程的使用,你能索引一个基于URL链接的Web页面,启动一个新的线程跟随每个新的URL链接,索引一个新的URL起点。当然在服务器上所开的线程也不能无限膨胀,需要在服务器的正常运转和快速收集网页之间找一个平衡点。在算法上各个搜索引擎技术公司可能不尽相同,但目的都是快速浏览Web页和后续过程相配合。目前国内的搜索引擎技术公司中,比如百度公司的网络蜘蛛采用了可定制、高扩展性的调度算法使得搜索器能在极短的时间内收集到最大数量的互联网信息,并把所获得的信息保存下来以备建立索引库和用户检索。
2、处理网页。搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引库和索引。其他还包括去除重复网页、分词(中文)、判断网页类型、分析超链接、计算网页的重要度/丰富度等。
索引库的建立关系到用户能否最迅速地找到最准确、最广泛的信息,同时索引库的建立也必须迅速,对网络蜘蛛抓来的网页信息极快地建立索引,保证信息的及时性。对网页采用基于网页内容分析和基于超链分析相结合的方法进行相关度评价,能够客观地对网页进行排序,从而极大限度地保证搜索出的结果与用户的查询串相一致。新浪搜索引擎对网站数据建立索引的过程中采取了按照关键词在网站标题、网站描述、网站URL等不同位置的出现或网站的质量等级等建立索引库,从而保证搜索出的结果与用户的查询串相一致。新浪搜索引擎在索引库建立的过程中,对所有数据采用多进程并行的方式,对新的信息采取增量式的方法建立索引库,从而保证能够迅速建立索引,使数据能够得到及时的更新。
3、提供检索服务。用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页;为了用户便于判断,除了网页标题和URL外,还会提供一段来自网页的摘要以及其他信息。
用户检索的过程是对前两个过程的检验,检验该搜索引擎能否给出最准确、最广泛的信息,检验该搜索引擎能否迅速地给出用户最想得到的信息。对于网站数据的检索,新浪搜索引擎采用多进程的方式在索引库中检索,大大减少了用户的等待时间,并且在用户查询高峰时服务器的负担不会过高(平均的检索时间在0.3秒左右)。对于网页信息的检索,作为国内众多门户网站的网页检索技术提供商的百度公司其搜索引擎运用了先进的多线程技术,采用高效的搜索算法和稳定的UNIX平台,因此可大大缩短对用户搜索请求的响应时间。作为慧聪I系列应用软件产品之一的I-Search2000采用的超大规模动态缓存技术,使一级响应的覆盖率达到75%以上,独有的自学习能力可自动将二级响......余下全文>>
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
如果离婚共同财产被一方花完了法院怎么判
请问自然力量对地表变化的影响有哪些?自然力
人穷志短的近义词
天宝副食直销部这个地址在什么地方,我要处理
方松社区文化活动中心地址在什么地方,想过去
什么叫做STA组件?
再怎么帅的帅哥一秃顶是不是就完全不行了
MOD脚本合并工具Script Merger要怎么用
为什么我在家里有些房间连接WIFI热点时网络很
某组数据分布的偏度系数为负时,该数据的众数
幼儿园时我们一起上学放学的英语
钟祥鸿宇宾馆地址在什么地方,我要处理点事
榆次民营科技园地址在哪,我要去那里办事
拳皇97神乐千鹤倒地起身怎样破解大门的第一时
who have lived long in confinement,A clerk
推荐资讯
湴波在什么地方啊,我要过去处理事情
关于中国民航大学的专业体检
高分求一个好看的动态桌面
led灯5730-2b4c-8d-4h是多少瓦
请问,高手000830,000952,002072,000036走
求关于各种爱情的词语缩写!!!
工程造价实习是去南方好还是北方好,能做什么
用身份证办的按揭手机逾期了一个星期才还款,
陶正陶瓷刀怎么样
百世汇通单号丢了要怎么查询呢?
【三峡是哪三个峡的总称】“三峡”是哪三个峡
延边大学护理学是几年制的
正方形一边上任一点到这个正方形两条对角线的
阴历怎么看 ?