Q:非洲食人族的酋长吃什么?

反复执行同一个es查询请求,返回结果时有时无

Elasticsearch | 作者 chrisxucd123 | 发布于2020年07月01日 | 阅读数:4971

软件版本:  es 6.5.4,有xpack插件
运行环境:  es集群有3个节点:node1,node3,node4, 参数配置基本都是默认配置。集群、节点、索引分片等的健康状态都是green。smas_email索引设置为6个分片,2个副本.其中,mailId字段定义为
"mailId":{
"type":"text",
"fields":{
"keyword":{
"type":"keyword",
"ignore_above":256
}
}
}

es数据写入是采用10个线程并发写入,每个线程一次共大概会写1000条左右的文档数据,每天写1到5次。写入时都默认向node3这个es节点写入。系统运行半年一直是正常的。 直到最近一个月出现下面的问题。
 
错误现象:
    在项目工程中通过http方式反复执行同一个es查询语句,查询最近导入的文档内容,返回结果时有时无. 在kibana中执行es查询语句,现象一样.   对有的mailId来说,返回结果是周期性地1次成功,2次失败,对有的mailId,是周期性地2次成功,1次失败, 对以前很早导入的文档,都能查询成功.  应该不是一致性问题,这个现象10多天来一直存在.
    查看es日志,没有看到相应的错误日志。
 
    es查询成功的示例截图

成功.png

 
    es查询失败的示例截图

失败.png

 
在排查过程中也发现几个奇怪的现象.
1、在上面查询语句中增加  ?preference=_primary_first , 会导致查询全部失败.
2、查看索引分片情况. 主分片全部分配在node1 这台服务器上. 另外,两个副本中,1个副本的文档数与主分片一致,另外一个副本的文档数大于主分片文档数.

图片3.png

 
 

附件:
smas_email的mapping定义

smas_email的mapping定义.png



es配置文件elasticsearch.yml

es配置文件elasticsearch.yml_.png

 
 
 
 
请教各位大神:
1、这个问题是什么原因导致的?
2、在不重建索引和重新导入数据的情况下,有什么办法能比较稳妥地修复这个问题?
3、如果一定要重建索引,怎么做才能保证从主分片和副本中获取到完整的历史数据?(因为一个副本中的文档数居然比主分片还多不少)
 
 
已邀请:

alex_farm

赞同来自:

有用到ik么,最近有修改过词库么

chrisxucd123

赞同来自:

没有用到ik分词器.   对导入的这些文档记录,业务处理中会有一些update操作,修改个别字段的值.

pony_maggie - 公众号:犀牛饲养员的技术笔记

赞同来自:

主副分片文档数量不一致可能是罪魁祸首,es查询默认情况下会随机选择分片或者其副本,所以导致同样的查询结果不一致。

tacsklet - 公司有用到es

赞同来自:

想了解一下主副分片文档数量不一致是怎么产生的,还没试过这种情况,想试试。这种状态下分片状态也是green吗

chrisxucd123

赞同来自:

主副分片文档数量不一致确实很可能是导致错误现象的原因,  最好能知道原因后面就可以采取措施避免再次出现,     另外,在现有基础上,如何修复这个smas_email,让它的两个副本文档数一致也是一个问题?    我们当时准备用  
PUT /smas_mailheader/_settings
{
"number_of_replicas": 1
}
这个命令,先把副本数设置为1,   再设置为2.  相当于让es自动重建副本.   但因为有一个副本的文档数比主分片还大,担心减少副本时把这个文档数大的副本给删掉了,就可能导致数据丢失.所有没有这样操作.

redhat

赞同来自:

默认情况下,写入数据时,会先写入主分片,主分片成功后,再并发写入副本分片,当所有副本分片成功后,才会返回成功。你是不是将replication改成async了

要回复问题请先登录注册