我能想到的是用pipeline去设值,但是好像没有直接的接口可以把这个值取出来?
{
"content":"今天天气不错"
}
分词结果:今天,天,天气,不错
最后存下来的文档为:{
"content":"今天天气不错",
"words":"今天 天 天气 不错"
}
如果能对分词结果去重的话就更完美了
2 个回复
rochy - rochy_he
赞同来自:
如果想获取分词结果,调用 _analyze 接口即可
hapjin
赞同来自:
比如:
然后,再通过就能拿到分词结果。
我一般用这个来测试,生产环境不会开启它。
2,分词结果的去重,是与你配置的Analyzer分词器(Analyzer流程)有关的。
想看下某个字段 存储的 分词结果 还是可以的。。。。how-to-get-tokens-for-a-document
我自己测试了一下:
PUT了一篇文档:
PUT user/profile/1
{
"nick":"人生 如梦"
}
Term情况: