好的想法是十分钱一打,真正无价的是能够实现这些想法的人。

es是如何判度写入的记录是插入还是更新?

Elasticsearch | 作者 陈水鱼 | 发布于2019年07月18日 | 阅读数:3477

es写入数据的时候,如何判断是写入还是更新,是否存在由于大数据量的写入,每个记录都判断是否存在,而消耗了大量的写入速度?有没有像hbase那样通过bloom过滤器来判断id是否存在?
已邀请:

code4j - coder github: https://github.com/rpgmakervx

赞同来自: 陈水鱼

所以es推荐你用引擎创建id而不是自己提供id,这样能确保ID不重复,减少id校验的开销,这个在tps很高的场景下效率能提高很多,我测试过批量写日志,平均每条1.4ms,使用自动创建后每条降低到0.9ms。

HelloClyde

赞同来自:

你的理解是对的,的确会降低写入速度

God_lockin

赞同来自:

指定id会去判断,不指定就直接插入

要回复问题请先登录注册