永发信息网

用java做一个教育资源的基于概念语义查询扩展的智能搜索引擎系统,具体步骤是什么?

答案:2  悬赏:0  手机版
解决时间 2021-03-08 12:38
我是一名研二的学生,专业是计算机,我的java水平很差,是自学的,从来没有接触过搜索引擎方面的知识,我看了好多这方面的论文,但是只明白原理,但具体怎样做还不知从何下手,想问要补哪些课?

lanangle@163.com我的邮箱
最佳答案
你可以做一个基于你本学校网站的搜索引擎,这个应该很容易实现1。第一步:先用网络爬虫将你学校网站上的网页抓取下来,存放在本地(对于每个网页根据其内容赋予不同的权值,这里的权值,怎么说呢,这个网页的主要内容吧~);第二不:可以用jsp写一个搜索引擎网站;第三步:编写中文分词代码(当然现在已经有很多成熟的软件);第四步:上网搜一些什么根据关键字查找本地网页的算法(这一步最关键,这个应该是最难的,我感觉);第五步:剩下的我感觉应该很容易了,接收用户输入,分词,提取关键词汇,查找本地网页数据库,显示查找结果(那些快照就是本地保存的网页)。 这只是一个小型的娱乐型搜索,还要用网络爬虫定期更新本地存放的网页。(补充:如果你想做的更好,可以用多标签分类,每个网页是一个bag,含有多个instance,每个instance包含多个attribute,根据多标签分类可以查找到更多的网页,给用户更多的选择。只是我的一点建议,我今年大三,我做过一点网络爬虫,中文分词,多标签分类,jsp。) 对了,又看了一下问题,你是要做基于概念语意的搜索引擎,之前我做过一个东西用到了董镇东他们的HowNet,有一个词汇语意相似度的计算,我的理解呢:根据用户输入的文本,分词,查找语意相似度非常大的词汇(比如:用户输入“关公”,我们不应该只返回“关公”的网页,我们要把“关二爷”、“武圣人”、、、相关的网页都返回给用户,还有一点:我们可以在下面给出选择,把那些相似度非常小,也就是反义词,列出来,根据人类的习惯,好多时候下会想到反义词,这样我感觉能给用户更好的感受)。仅仅是个人意见,仅供参考。有什么问题我们可以一起商量。
全部回答
你好! 我给,baidu hi联系,email? Q? 如果对你有帮助,望采纳。
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
襄城县许昌万家乐超市(襄城县会计核算中心南)
有没有单机格斗联机手机游戏,内存较小的,谢
wps演示如何退出登录
求问,拉布拉多可以当土狗一样养吗
男主角叫行止的古言小说
做功的位移以地面为参考系,如果这样的话,把一
名家装饰工程有限公司地址在什么地方,想过去
猎仇者的介绍
手心发热出汗跟什么有关,气虚
zippo打火机如何加煤油
我想给孩子的出生证明上改父母的名字要怎么改
哪位大神有重庆卫视的 中国超模 的百度云资源
平凡之路 MV里面的车是POLO吗
车水箱没水开了20公里发动机冒烟有事吗
【三角函数的公式】三角函数的有关公式都有哪
推荐资讯
怎样才能删除状态栏里的广告通知
老公打了老婆后,又是下跪,又是道歉,我觉得
我准备把客厅的墙裙用浅黄色的瓷砖一直贴到顶
Rotation refers to the turning of the eath
有关于苏轼的小故事吗?
山西三大二院风湿科李晓峰多会坐诊腿麻。没感
有每天睡眠时间不超过四小时的吗
下图为某处地层的地质剖面图。【小题1】图中
请问,小年是腊月廿三吗?,
爱尚鲜花礼仪怎么去啊,有知道地址的么
大鼓声音怎么形容
【水火箭制作方法】物理实验水火箭和火箭的制
正方形一边上任一点到这个正方形两条对角线的
阴历怎么看 ?