倒排索引

倒排索引

倒排索引 数字和日期类型的问题

Elasticsearchcodepub 回复了问题 • 4 人关注 • 3 个回复 • 605 次浏览 • 2018-04-23 17:10 • 来自相关话题

关于倒排索引中搜索结果合并不太理解的地方

Elasticsearchstrglee 回复了问题 • 2 人关注 • 1 个回复 • 243 次浏览 • 2018-04-01 11:43 • 来自相关话题

elasticsearch 倒排索引

Elasticsearchkennywu76 回复了问题 • 2 人关注 • 1 个回复 • 2394 次浏览 • 2017-05-19 09:31 • 来自相关话题

条新动态, 点击查看
匿名用户

kennywu76 回答了问题 • 2017-12-18 11:06 • 3 个回复 不感兴趣

倒排索引 数字和日期类型的问题

赞同来自:

早期ES/Lucene版本是将数值转换成字符串形式,利用倒排表做查找的。 为了解决离散的数值多带来的查找性能问题,Lucene在编排倒排表的时候,比较巧妙的引入了一些特殊的Term,比如"
50x75=[doc40,doc41,doc53,doc78... 显示全部 »
早期ES/Lucene版本是将数值转换成字符串形式,利用倒排表做查找的。 为了解决离散的数值多带来的查找性能问题,Lucene在编排倒排表的时候,比较巧妙的引入了一些特殊的Term,比如"
50x75=[doc40,doc41,doc53,doc78,doc99,...]", 表示50-75这个范围的数值包含在后面哪些文档列表里。由此“
50 OR 51 OR 52 ... OR 100”这样的范围查找,被优化成类似“50x75 OR 76x99 OR 100"这样的形式。 对于该算法的详细解释参考:  https://blog.parse.ly/post/1691/lucene/  
 
从ES5.0版本(Lucene 6.0)开始,对于数值型字段,改用了k-d tree这种数据结构编码。 改用这种数据结构以后,数值型数据的索引以及范围查找效率比之前用倒排编码的方式提高很多。参考:  https://www.elastic.co/blog/lucene-points-6.0
 

倒排索引 数字和日期类型的问题

回复

Elasticsearchcodepub 回复了问题 • 4 人关注 • 3 个回复 • 605 次浏览 • 2018-04-23 17:10 • 来自相关话题

关于倒排索引中搜索结果合并不太理解的地方

回复

Elasticsearchstrglee 回复了问题 • 2 人关注 • 1 个回复 • 243 次浏览 • 2018-04-01 11:43 • 来自相关话题

elasticsearch 倒排索引

回复

Elasticsearchkennywu76 回复了问题 • 2 人关注 • 1 个回复 • 2394 次浏览 • 2017-05-19 09:31 • 来自相关话题