永发信息网

ElasticSearch搜索可以自定义去重吗

答案:2  悬赏:80  手机版
解决时间 2021-01-25 14:52
ElasticSearch搜索可以自定义去重吗
最佳答案
使用terms聚合可以解决去重的问题 然后嵌套使用top hits聚合在每个分组中得到一个文档
全部回答
首先es是基于lucene这个非常成熟的索引方案,另加上一些分布式的实现:集群,sharding,replication等。 es的优势主要可以看以下几个方面: 1. 横向可扩展性:只需要增加一台服务器,做一点儿配置,启动一下es进程就可以并入集群; 2. 分片机制提供更好的分布性:同一个索引分成多个分片(sharding),这点类似于hdfs的块机制;分而治之的方式来提升处理效率,相信大家都不会陌生; 3. 高可用:提供复制(replica)机制,一个分片可以设置多个复制,使得某台服务器宕机的情况下,集群仍旧可以照常运行,并会把由于服务器宕机丢失的复制恢复到其它可用节点上;这点也类似于hdfs的复制机制(hdfs中默认是3份复制); 当然,也要知道其不足之处: 1. 各节点的一致性问题:其默认的机制是通过多播机制,同步元数据信息,但是在比较繁忙的集群中,可能会由于网络的阻塞,或者节点处理能力达到饱和导致各节点元数据不一致——也就是所谓的脑裂问题,这样会使集群处于不一致状态。目前并没有一个彻底的解决方案来解决这个问题,但是可以通过将工作节点与元数据节点分开的部署方案来缓解这种情况。 2. 没有细致的权限管理机制,也就是说,没有像mysql那样的分各种用户,每个用户又有不同的权限。所以在操作上的限制需要自己开发一个系统来完成; 总结:不过从优势与不足的对比看,我看还是瑕不掩瑜,是值得一试的技术。
我要举报
如以上问答信息为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
大家都在看
审查元素怎么修改代码
把一个圆平均分成若干份,剪开后拼成一个近似
红米手机wifi下载速度慢只40k/s 但浏览网页都
宝马525,奔驰E260和奥迪A6,纠结买哪个好
保时捷7182.5t与7182.0t差距有多大
骨组织的营养物质供应主要依靠骨膜中的血管。
什么是动态核查?动态核查怎么查?
纯棉儿童毛衣穿久了会起球吗?起球厉害不?
机器是尼康d610,有一个50mm f1.8d的镜头了,
下列哪项不是动物行为的意义A. 有利于获取食
请问梦见头顶凹进去了一个洞,但是没破,一点
太和团结旅社地址有知道的么?有点事想过去
美多艺影专业照相地址好找么,我有些事要过去
高一学生成绩如何查到
下列几种生态系统中,遭破坏后最难恢复的是DA
推荐资讯
宏轩文印怎么去啊,我要去那办事
发稿前的稿件整理工作主要包括()等。A.复查
霓裳会馆地址好找么,我有些事要过去
和相亲对象聊了半年后确定关系,因为异地,关
有一款洗发水 瓶子上有花中贵族
在“共和革命百年”即将到来之际,著名学者杨
两湖村地址在什么地方,我要处理点事
待业大学毕业生多不多?
怎么写认识啊
到银行柜台汇款怎么汇?
刘禹锡成就有哪些?????
下列有关显微镜(目镜为10×,物镜为10×。视野
正方形一边上任一点到这个正方形两条对角线的
阴历怎么看 ?