我有点怀疑你在刷屏

6.8跨集群查询(CCS) 偶发性查询超时

Elasticsearch | 作者 viewsite | 发布于2020年08月14日 | 阅读数:1319

背景:两个很大的业务集群,100节点以上,互相在cluster setting 配置了对方为remote,然后发起跨集群查询,查询本地耗时1~5s,设置Client 客户端超时120s,频繁出现120s 也不返回结果

怀疑点 & 想法
1. 集群规模比较大,有可能集群间、节点间网络、某一台机器存在问题,大佬们有比较好的排查方式么?
2. CCS 机制有问题,抓堆栈,分析debug 源码看看..... 大佬们有熟悉CCS的么?
已邀请:

Charele - Cisco4321

赞同来自:

比如两个集群A,B,
确定几个事,
是不是分别去查A和B时,响应速度都正常?(就是只用LocalSearch,不涉及remote index)
 
同一个混合查询,是不是分别在A和B上执行时肯定都不正常?
 
还有,你找一个能正常完成的混合查询,能不能在任何地方看到有任何报错信息。

viewsite

赞同来自:

问题已经有进展,业务并发发送了大量CCS 聚合,导致查询压力很大,降低聚合的并发后,没有再出现卡顿现象

要回复问题请先登录注册