你的浏览器禁用了JavaScript, 请开启后刷新浏览器获得更好的体验!
输入关键字进行搜索
搜索:
发现
分享
文章
活动
登录
使用 dmesg 来查看一些硬件或驱动程序的信息或问题。
如果要索引的文本重复率很高有什么好的解决方案?
Elasticsearch
| 作者
cht
| 发布于2020年01月09日 | 阅读数:
1839
分享到:
QQ空间
新浪微博
微信
QQ好友
印象笔记
有道云笔记
使用es作为搜索引擎,存储的数据都是个人数据。但是个人数据之间的文档重复率可能很高(80%以上文件重复)。搜索只能搜用户自己的数据。类似于网盘这种场景。
每个人的数据都建索引 存储浪费。如果针对文档md5纬度做索引,对应用户有比较复杂。
这种有什么好的方案没有?
没有找到相关结果
已邀请:
与内容相关的链接
提交
1 个回复
God_lockin
赞同来自:
这怎么看着像权限系统?比如做不同的字段给个人/group/department…
然后对不同的用户搜索的时候把他们自己的id(对应个人),groupId/deptId…拼在dsl里面,比如must/must_not之类的filter可以吗
要回复问题请先
登录
或
注册
发起人
cht
活动推荐
Jun
17
搜索客 Meetup 讲师招募(长期有效)
线上
·
6-17 周一
·
进行中
Apr
25
第25届 GOPS 全球运维大会暨研运数智化技术峰会 · 深圳站
深圳
·
4-25 周五
·
报名中
May
15
Workshop | 搜索服务统一治理(跨引擎多个集群监控管理、流量管控、服务编排)
北京
·
5-15 周四
·
报名中
May
16
2025XCOPS智能运维管理人年会
广州
·
5-16 周五
·
报名中
May
29
Workshop | Coco AI - 开源智能搜索与知识库管理
北京
·
5-29 周四
·
报名中
相关问题
索引某个shard无法恢复的问题
有没有用ELK收集数据中心所有网络设备日志的解决方案?
elasticsearch 中的store 以及倒排索引的问题
集群索引数建议?
怎样有效解决0点数据写新索引时的性能问题?
ES可以通过别名来增加或者删除数据吗,别名只对应了一个索引,该如何操作呢
elasticSearch5.X javaAPI rangeQuery分区间查询,最终用了一种最low的方法凑合?不知大神们有没有好解决方案?
logstash同步多张相同表结构的数据表到同一个索引
倒排索引 数字和日期类型的问题
什么插件可以定时清理索引
如果索引频繁更新,缓存会怎么办
问题状态
最新活动:
2020-01-10 10:10
浏览:
1839
关注:
2
人
1 个回复
God_lockin
赞同来自:
然后对不同的用户搜索的时候把他们自己的id(对应个人),groupId/deptId…拼在dsl里面,比如must/must_not之类的filter可以吗