即使是不成熟的尝试,也胜于胎死腹中的策略。

bulk批量导入数据后查询的数据条数几乎都是3000或4000等这样的数据且不对

Elasticsearch | 作者 tcl | 发布于2017年04月28日 | 阅读数:3918

通过滚屏查询把一个集群里的数据拷贝到本地,拷贝完的数据和集群里的数据条数是一样的,然后在通过bulk批量导入数据。导入后的数据和集群的数据量也是一样的。  
问题来啦: 相同的查询语句,在集群里查的数据和本地查询的语句返回的条数不一样。
比如 集群是 16871  本地是 30000  ;
   集群是 41262  本地是40000。
 
本地的数不尽不对还很奇怪。这是啥原因? 有大神了解吗?
已邀请:

fhyes123 - ES小白

赞同来自:

虽然数据一致,但是导入时存储的分词规则可能不一致(即使你是使用的默认的分词,也可能在其他数据集里导过来之前就已经被分词了),所以查询到的数据也就不一致
匿名用户

匿名用户

赞同来自:

你好,修复了么,我也遇到了类似的问题,使用python存储到本地json文件后,然后用helpers.bulk批量导入后,会少10%的数据量,副本数设置0也没用

要回复问题请先登录注册