你的浏览器禁用了JavaScript, 请开启后刷新浏览器获得更好的体验!
输入关键字进行搜索
搜索:
发现
分享
文章
活动
登录
居然是你
如果要索引的文本重复率很高有什么好的解决方案?
Elasticsearch
| 作者
cht
| 发布于2020年01月09日 | 阅读数:
1530
分享到:
QQ空间
新浪微博
微信
QQ好友
印象笔记
有道云笔记
使用es作为搜索引擎,存储的数据都是个人数据。但是个人数据之间的文档重复率可能很高(80%以上文件重复)。搜索只能搜用户自己的数据。类似于网盘这种场景。
每个人的数据都建索引 存储浪费。如果针对文档md5纬度做索引,对应用户有比较复杂。
这种有什么好的方案没有?
没有找到相关结果
已邀请:
与内容相关的链接
提交
1 个回复
God_lockin
赞同来自:
这怎么看着像权限系统?比如做不同的字段给个人/group/department…
然后对不同的用户搜索的时候把他们自己的id(对应个人),groupId/deptId…拼在dsl里面,比如must/must_not之类的filter可以吗
要回复问题请先
登录
或
注册
发起人
cht
活动推荐
Apr
12
2024 DTC 数据技术嘉年华:汇聚行业精英,共襄年度盛宴
北京
·
4-12 周五
·
报名中
相关问题
索引某个shard无法恢复的问题
有没有用ELK收集数据中心所有网络设备日志的解决方案?
集群索引数建议?
logstash同步多张相同表结构的数据表到同一个索引
ES可以通过别名来增加或者删除数据吗,别名只对应了一个索引,该如何操作呢
怎样有效解决0点数据写新索引时的性能问题?
elasticSearch5.X javaAPI rangeQuery分区间查询,最终用了一种最low的方法凑合?不知大神们有没有好解决方案?
elasticsearch 中的store 以及倒排索引的问题
ES2.3版本,delete一个索引,master日志并没有记录相关delete操作?
怎么设置让索引文件全部在内存中查询
倒排索引 数字和日期类型的问题
问题状态
最新活动:
2020-01-10 10:10
浏览:
1530
关注:
2
人
1 个回复
God_lockin
赞同来自:
然后对不同的用户搜索的时候把他们自己的id(对应个人),groupId/deptId…拼在dsl里面,比如must/must_not之类的filter可以吗