Elasticsearch：inverted index，doc_values及source

Elasticsearch | 作者 liuxg | 发布于2019年10月20日 | 阅读数：1952

Elasticsearch的每个shard里实际上是一个Lucene的索引。在这个索引里，它包含每个文档的inverted index, doc_values及source。在实际的使用中，我们该如何管理它们，比如对有的字段不进行索引，或者为了节省空间，不存储doc_values，对于某些字段不进行存储等。详细阅读请参阅链接https://blog.csdn.net/UbuntuTo ... 42703

更多阅读，请参阅：https://blog.csdn.net/ubuntutouch

2 个回复

hapjin

其实我觉得ElasticSearch的每个shard里面有多个Segments，每个Segment是可搜索的，也即：Segment才是真正对应Lucene索引(term dictionary index 、inverted index)。这也是为什么merge segment能够提升搜索的效率，并且提供ES进程内存"使用率"的原因吧(多个小的segments merge 成一个大Segment时，所有segments占用的内存空间变小了)，个人理解，可能有错。

liuxg - Elastic

如果一个很大的segment也会造成资源的浪费，比如内存的消费。在实际的使用中，需要根据实际的情况而定。在我最近的一篇文章中https://blog.csdn.net/UbuntuTo ... 28987 讲述了index的生命周期。我们可以把不太常用的index的replica变为一，同时也可以使用‘

POST shrink-logs-000001/_forcemerge?max_num_segments=1

来forcemerge使得segments的数量是我们需要的。

要回复问题请先登录或注册

Elasticsearch：inverted index，doc_values及source

2 个回复

发起人

活动推荐

相关问题

问题状态

Elasticsearch：inverted index，doc_values及source

与内容相关的链接

2 个回复

发起人

活动推荐

相关问题

问题状态