三人行必有我师

elasticsearch搜索大文档时highlight导致CPU占满

Elasticsearch | 作者 liyh | 发布于2017年09月14日 | 阅读数:5823

两份一千多页的pdf文档,读取出内容content后,长度分别在2000000左右,将content作为一个filed,整个es就保存了这两篇文档。查询时,加入highlight,但是CPU占用马上就上去了,貌似是highlight导致jvm full gc了,查询时间也超过了一秒,这种情况应该怎么优化?
 
通过elasticsearch-mapper-attachments插件来对pdf文件做索引能改善这种情况吗?有相关的说明文档或问题可以分享给我阅读,感激不尽,被这个问题困扰了好久,提升了硬件配置后,查询快了一些,但还是不够快,这还是在只有一个用户的测试情况下。。。。。。
已邀请:

kennywu76 - Wood

赞同来自: liyh 白衬衣 laoyang360

可以试一下fast-vector-highlighter, 对大字段可能会快一些。  https://www.elastic.co/guide/e ... ghter

白衬衣 - 金桥

赞同来自: liyh

es本身的高亮性能不好,建议把高亮放到浏览器或者其他的展现层来做。
可以用profile api看下具体的消耗。

要回复问题请先登录注册