两份一千多页的pdf文档,读取出内容content后,长度分别在2000000左右,将content作为一个filed,整个es就保存了这两篇文档。查询时,加入highlight,但是CPU占用马上就上去了,貌似是highlight导致jvm full gc了,查询时间也超过了一秒,这种情况应该怎么优化?
通过elasticsearch-mapper-attachments插件来对pdf文件做索引能改善这种情况吗?有相关的说明文档或问题可以分享给我阅读,感激不尽,被这个问题困扰了好久,提升了硬件配置后,查询快了一些,但还是不够快,这还是在只有一个用户的测试情况下。。。。。。
通过elasticsearch-mapper-attachments插件来对pdf文件做索引能改善这种情况吗?有相关的说明文档或问题可以分享给我阅读,感激不尽,被这个问题困扰了好久,提升了硬件配置后,查询快了一些,但还是不够快,这还是在只有一个用户的测试情况下。。。。。。
2 个回复
kennywu76 - Wood
赞同来自: liyh 、白衬衣 、laoyang360
白衬衣 - 金桥
赞同来自: liyh
可以用profile api看下具体的消耗。