不为失败找理由,要为成功找方法。

Elasticsearch:inverted index,doc_values及source

Elasticsearch | 作者 liuxg | 发布于2019年10月20日 | 阅读数:1258

Elasticsearch的每个shard里实际上是一个Lucene的索引。在这个索引里,它包含每个文档的inverted index, doc_values及source。在实际的使用中,我们该如何管理它们,比如对有的字段不进行索引,或者为了节省空间,不存储doc_values,对于某些字段不进行存储等。详细阅读请参阅链接https://blog.csdn.net/UbuntuTo ... 42703

更多阅读,请参阅:https://blog.csdn.net/ubuntutouch
已邀请:

hapjin

赞同来自:

其实我觉得ElasticSearch的每个shard里面有多个Segments,每个Segment是可搜索的,也即:Segment才是真正对应Lucene索引(term dictionary index 、inverted index)。这也是为什么merge segment能够提升搜索的效率,并且提供ES进程内存"使用率"的原因吧(多个小的segments merge 成一个大Segment时,所有segments占用的内存空间变小了),个人理解,可能有错。

liuxg - Elastic

赞同来自:

如果一个很大的segment也会造成资源的浪费,比如内存的消费。在实际的使用中,需要根据实际的情况而定。在我最近的一篇文章中https://blog.csdn.net/UbuntuTo ... 28987 讲述了index的生命周期。我们可以把不太常用的index的replica变为一,同时也可以使用‘
 
POST shrink-logs-000001/_forcemerge?max_num_segments=1
 
来forcemerge使得segments的数量是我们需要的。
 

要回复问题请先登录注册