提问要多花一点心思哦

哪种类型的数据会占用大量terms_memory,有何优化方案?

zqc0512 回复了问题 • 6 人关注 • 3 个回复 • 2767 次浏览 • 2018-07-05 17:16 • 来自相关话题

windows运行ElasticSearch.bat报错

Dm 回复了问题 • 2 人关注 • 1 个回复 • 4099 次浏览 • 2018-07-05 14:47 • 来自相关话题

elasticsearch5.2.0安装时Could not find any executable java binary.

Dm 回复了问题 • 2 人关注 • 1 个回复 • 3616 次浏览 • 2018-07-05 14:42 • 来自相关话题

elasticsearch多重聚合、排序、性能

medcl 回复了问题 • 4 人关注 • 1 个回复 • 3096 次浏览 • 2018-07-05 12:59 • 来自相关话题

xpack rollup功能是否以后还有?

medcl 回复了问题 • 3 人关注 • 1 个回复 • 3570 次浏览 • 2018-07-05 12:45 • 来自相关话题

es日报收不到

medcl 回复了问题 • 2 人关注 • 1 个回复 • 1775 次浏览 • 2018-07-05 12:39 • 来自相关话题

ElasticSearch不知道怎么插入数据

大慈大悲掌 回复了问题 • 2 人关注 • 1 个回复 • 2273 次浏览 • 2018-07-04 17:25 • 来自相关话题

ElasticSearch6.1.2数据插入问题

zjn_job 回复了问题 • 4 人关注 • 3 个回复 • 5469 次浏览 • 2018-07-04 16:58 • 来自相关话题

ES内存分配规划

yayg2008 发表了文章 • 2 个评论 • 9016 次浏览 • 2018-07-04 15:15 • 来自相关话题

阅读本文前,请先阅读[ES内存分析](https://elasticsearch.cn/article/698)。
ES默认配置下,heap是存在超卖情况的。


| 类目 | 默认占比 | 是否常驻 | 淘汰策略(在控制大小情况下) | 控制参数 |
| --- | --- | --- | --- | --- |
| query cache | 10% | 是 | LRU | indices.queries.cache.size |
| request cache | 1% | 是 | LRU | indices.requests.cache.size |
| fielddata cache | 无限制 | 是 | LRU | indices.fielddata.cache.size |
| segment memory | 无限制 | 是 | 无 | 不能通过参数控制 |
| common space | 70% | 否 | GC | 通过熔断器 indices.breaker.total.limit 限制 |

common space(可GC)


| 子类目 | 默认占比 | 控制参数 |
| --- | --- | --- |
| indexing buffer | 10% | indices.memory.index_buffer_size |
| request agg data | 60% | indices.breaker.request.limit |
| in-flight data | 100% | network.breaker.inflight_requests.limit |

通过上表可知,segment memory是非常重要,而且是不可通过参数干预的内存空间,而cache部分则可以提升性能,可以被清除。common space 是运行时的动态空间,可以被GC。

综上所述,需要保证segment memory+cache+common space不超过100%。由于熔断器是按整个heap大小来计算的,所以如果segment memory 过大,仍然可能会导致OOM。为了减少这种情况的发生,需要预留足够空间给segment。
优化

  1. 限制fielddata大小,fielddata是针对text类型进行排序、聚合才用到。正常应该避免这种情况发生。
  2. 限制request agg data大小,这个参数会影响聚合使用的内存,如果触发熔断,业务需要进行优化。

    内存分配




     
       
         
         
         
       
       
         
           
           
           
         
         
           
           
           
         
         
           
           
           
         
         
           
           
           
         
         
           
           
           
         
         
           
           
           
         
         
           
           
         
       
     

             
    segment memory

           

             
    预留10%

           

             

           

             
    fielddata cache

           

             
    限制在20%

           

             

           

             
    query cache

           

             
    限制10%

           

             

           

             
    request cache

           

             
    限制1%

           

             

           

             
    indexing buffer

           

             
    限制10%

           

             

           

             
    request agg data

           

             
    限制1%

           

             
    父熔断器配置30%,扣除fielddata,agg剩余的就是in-flight

           

             
    in-flight data

           

             
    限制9%

           



    参数设置
    ```plain
    indices.fielddata.cache.size:1%--需要重启节点

    PUT _cluster/settings
    {
      "persistent": {
        "indices.breaker.fielddata.limit":"20%",
        "indices.breaker.request.limit":"1%",
        "indices.breaker.total.limit":"70%"

      }
    }
    ```

请教使用dynamic_mapping模式插入纯数字字符串遇到的问题

回复

zhuangfy92 发起了问题 • 1 人关注 • 0 个回复 • 2072 次浏览 • 2018-07-04 15:08 • 来自相关话题

ES内存使用分析及熔断器设置

yayg2008 发表了文章 • 0 个评论 • 13266 次浏览 • 2018-07-04 15:08 • 来自相关话题

内存占用

ES的JVM heap按使用场景分为可GC部分和常驻部分。
可GC部分内存会随着GC操作而被回收;
常驻部分不会被GC,通常使用LRU策略来进行淘汰;
内存占用情况如下图:

jvm.png





common space包括了indexing buffer和其他ES运行需要的class。indexing buffer由indices.memory.index_buffer_size参数控制, 默认最大占用10%,当full up后,该部分数据被刷入磁盘对应的Segments中。这部分空间是可以被回收反复利用的。

queryCache 是node级别的filter过滤器结果缓存,大小由indices.queries.cache.size 参数控制,默认10%。使用LRU淘汰策略。

requestCache是shard级别的query result缓存,通常 only requests of size 0 such as aggregations, counts and suggestions will be cached。使用LRU淘汰策略。通过indices.requests.cache.size参数控制,默认1%。设置后整个NODE都生效。

fieldDataCache,针对text字段,没有docValues属性(相当于列存储),当对text类型字段进行sort,agg时,需要将对应的字段内容全部加载到内存,这部分数据就放在fieldDataCache。通过indices.fielddata.cache.size 参数限制大小,默认不限制。这种情况下,占用内存会逐渐增多,直到触发熔断;新数据无法加载。

segmentsMemory ,缓存段信息,包括FST,Dimensional points for numeric range filters,Deleted documents bitset ,Doc values and stored fields codec formats等数据。这部分缓存是必须的,不能进行大小设置,通常跟index息息相关,close index、force merge均会释放部分空间。
可以通过命令
js<br /> GET _cat/nodes?v&h=id,ip,port,r,ramPercent,ramCurrent,heapMax,heapCurrent,fielddataMemory,queryCacheMemory,requestCacheMemory,segmentsMemory<br />

查看当前各块的使用情况。

熔断器

Elasticsearch 有一系列的断路器,它们都能保证内存不会超出限制:

  • indices.breaker.fielddata.limit
    fielddata 断路器默认设置堆的 60% 作为 fielddata 大小的上限。
  • indices.breaker.request.limit
    request 断路器估算需要完成其他请求部分的结构大小,例如创建一个聚合桶,默认限制是堆内存的 60%。它实际上是node level的一个统计值,统计的是这个结点上,各类查询聚合操作,需要申请的Bigarray的空间大小总和。 所以如果有一个聚合需要很大的空间,同时在执行的聚合可能也会被break掉。
  • indices.breaker.total.limit
    父熔断,inflight、request(agg)和fielddata不会使用超过堆内存的 70%。
  • network.breaker.inflight
    requests.limit 限制当前通过HTTP等进来的请求使用内存不能超过Node内存的指定值。这个内存主要是限制请求内容的长度。 默认100%。
  • script.max_compilations_per_minute
  • 限制script并发执行数,默认值为15。


    参考文档
    https://www.elastic.co/guide/e ... eaker
    https://www.elastic.co/guide/c ... .html
    http://zhengjianglong.leanote. ... %25AE

slow log里面怎么输出index和type? ES 2.4.1

回复

God_lockin 发起了问题 • 2 人关注 • 0 个回复 • 1866 次浏览 • 2018-07-04 14:54 • 来自相关话题

elasticsearch对binary类型数据的解析

回复

Win_Senven 发起了问题 • 1 人关注 • 0 个回复 • 2397 次浏览 • 2018-07-04 11:08 • 来自相关话题

es底层lucene保证indexwrite和translog的数据一致性,为什么还要采用2PC机制?

code4j 回复了问题 • 5 人关注 • 3 个回复 • 3266 次浏览 • 2018-07-03 20:58 • 来自相关话题

如何对如下数据搜索

回复

joycer 发起了问题 • 1 人关注 • 0 个回复 • 1477 次浏览 • 2018-07-03 13:05 • 来自相关话题