你不会是程序猿吧?

ES如何提升索引速度

Elasticsearch | 作者 mai | 发布于2019年08月09日 | 阅读数:508

一共8个节点,一个主节点,5个数据节点,数据量1TB,之前没有设置threadpool,数据上传用了10多天,想问一下怎么提升写入性能,以及threadpool改怎么设置能够有效提升索引速度和查询速度
已邀请:

bellengao - 博客: https://www.jianshu.com/u/e0088e3e2127

赞同来自:

threadpool一般不用设置;提升性能是一个比较大的话题了,需要从业务场景出发,可以先看一些文档了解了解https://cloud.tencent.com/deve ... 61269 ;https://www.elastic.co/guide/e ... .html

stone_xy

赞同来自:

节点什么配置?
我们测试过使用5个32U128GB数据节点+2个32U64GB coordinate节点,索引8TB数据也只需要10多个小时啊。
最基本的优化手段:
1. 先关闭replica,索引完成以后再开
PUT /twitter/_settings
{
"index" : {
"number_of_replicas" : 0
}
}

2. refresh interval 调大,如1分钟
PUT /twitter/_settings
{
"index" : {
"refresh_interval" : "60s"
}
}
3. 如果有比较大的字段,是否需要保存在_source

要回复问题请先登录注册