使用 nohup 或 disown 如果你要让某个进程运行在后台。

elasticsearch6.8 大宽表该如何设计

Elasticsearch | 作者 wzqiang1332 | 发布于2020年03月04日 | 阅读数:2782

大宽表数据来源是数据文件。
字段数大概1000左右,其中文本的字段比较少只有50个,其他都是数值类型,少量时间类型。每个字段都可能是查询条件
数据初始化导入一次,导入后只做查询。并且每天定时跑批更新一次数据。
如何设计索引,如何优化索引配置来快速的导入和更新数据。
目前的场景我用3台16C32G内存的机器做测试,
2600W数据,600字段时导入已经很慢,导完需要10个小时。导入完后es的size大概200G。导入数据非常慢。
大佬教我。。
已邀请:

locatelli

赞同来自:

1000个字段应该不是什么大问题。
 
可以先尝试一些共通的调优,特别是文档里介绍的那几点:https://www.elastic.co/guide/e ... .html
 
另外可以从业务角度考虑能否分拆索引,比如特定场景的业务查询只可能用到不超过100个字段那么就没有必要跟其它900个放在一起

要回复问题请先登录注册