Yu Tao

Yu Tao

威望 : 3 积分 : 1655 赞同 : 3 感谢 : 0

擅长话题

更多 »回复

0

你的分词是什么? 你现在是TF/IDF的算法,你试试 BM25

0

你的文档里面有没有 “张三A123” 的这行话?   match_phrase是需要按照顺序还查询的 如果文档里面没有的话,肯定查询不出来的

1

你服务器的内存是多大的?如果是32g的话 都设定到最大吧    gc overhead大概意思就是 物理内存不够用了 查你的jvm.option那个文件配置     

1

确实 我也遇到过这种问题,所以在全文搜索中我不用拼音分词。 另外,你要确认你的分词的使用场景是什么,你看现在大部分的拼音分词是在搜索栏当中用到的,如果是全文搜索还是尽量别用了 

0

你可以用 斯坦福的分词NLP,它有一个包 是 包含的所有的语言的 但是成本有点大,如果你需要集成到 es里面来的话

更多 »发问

0

108 次浏览  • 1 个关注   • 2019-09-07

2

414 次浏览  • 3 个关注   • 2019-01-10

1

798 次浏览  • 2 个关注   • 2019-01-03

更多 »动态

发问

回复

文章

最新动态

详细资料

个人成就:

威望: 3 积分: 1655 赞同: 3 感谢: 0

最后活跃:
2019-09-09 09:54
擅长话题:
gc overhead 1   0
更多 » 关注 1

medcl

更多 » 0 人关注
主页访问量 : 736 次访问