永发信息网

怎么用java 开发一个搜索引擎呀?

答案:1  悬赏:20  手机版
解决时间 2021-05-15 10:33
怎么用java 开发一个搜索引擎呀?
最佳答案
1.可以用lucene,lucene现在已经发展到1.9.1版了,相当稳定,网上中英文资源很丰富,甚至关于这个工具包的书(lucene in action)都有了.如果只是做站内搜索,可以直接从读数据库中读数据,调用lucene做索引.再写一个前台查询界面,调用lucene查询索引并在前台显示结果.
想一点程序都不写的话可以参考下面2个方案
2.用heritrix + nutchwax,heritrix也是一个很成熟的crawler,他将网页下载并压缩保存到arc格式的文件中,一个arc文件一般100兆左右,heritrix不解析提取网页的内容,nutchwax负责解析网页,丁取内容并建索引,nutchwax提供检索界面.缺点是nutchwax的安装很麻烦.
3.用nutch,一个超强的开源软件,作者就是lucene的作者,该软件的目标是做到和Google一样强大,nutch的很多分布式实现的思想来源于Google,目前已实现分布式crawler,和分布式检索,已经有人用他抓了几亿的网页,nutch功能包括了下载网页,解析网页,计算网页重要度,建索引,前台搜索等一个搜索引擎需要的绝大部分功能,用他来做站内搜索也很方便.该软件支持中文. nutch目前稳定的版本是0.7.2 用该软件的缺点是网上的中文资料不多.你要习惯看英文资料
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
邓州市南阳361度(邓州市北京路店)这个地址怎
怎么吧QQ秀里那个裸奔男去掉?
江汉区武汉金箭电动车地址是什么,有没有知道
人总是要死的,求快穿文《小受总是在死》txt完
圣诞节QQ有什么活动没有?
怎样可以使皮肤变的白一些
给大家猜个谜语;额头发黑,猜一女士用品
现在上三本有上分数一样的大专好么
DJ没有任何基础 能学会吗 ?
灰太狼那样的男人哪里找呀?
三教九流具体指哪些,有没有在乡镇工作的朋友,
大祥区邵阳隆回滩头饭店哪位知道具体地址啊
求三枝夕夏 IN db 唱的君と約束した優しいあ
在不用电脑时是否需要关闭猫灯
竹山县十堰宝丰镇计划生育服务站这个地址在什
推荐资讯
为什么qq开通了,就是没有显示图标?
栾川县洛阳圆梦房产中介(步行街)地址在哪里啊
当需要显示的信息离开CPU时,需要经过4个步骤
你们认为《儿童文学》上最好看的文章是什么?
2009年什么网络游戏好玩
比喻工作中无奈的诗句,有关信念坚定的诗句(
腾讯游戏 为什么主线的任务明明都完成了还不
大班春天诗歌教案,幼儿大班古诗教案该怎么写
班级口号小学二年级,班级口呼,口号二十三班
南岗区哈尔滨硬壳日料这个地址在什么地方,我
QQ空间如何才能做到完全加密?
穆棱市牡丹江四海网吧地址是什么,有没有知道
正方形一边上任一点到这个正方形两条对角线的
阴历怎么看 ?