Well,不要刷屏了

java 我已经分好词了怎么把词存入es,如果写插件的话存es调用什么接口

Elasticsearch | 作者 cuishuai6 | 发布于2021年04月26日 | 阅读数:1678

密文检索
{"马云":"1","财富":"2","人":"3","哺乳动物":"4"}
key是词,val是这个词在这个图片的相关度,因为是密文的图片检索,所以我这json串是通过加密算法转base64存es的,所以我就想写个接口或者改ik再或者自己手写一个分词器处理插件装到es中
主要问题是:
我现在不知道我分好词怎么能存到es中,es有这种的对外接口吗。我网上实在没找到---java 我已经分好词了怎么把词存入es,如果写插件的话存es调用什么接口,现在主要是不明白如何将分好的词存入es的倒排索引,或者之前用过ik插件要怎么改才能跳过ik本身的分词,使用我分好的词入es,请求大佬帮忙解答,网上的相关文献太少了
已邀请:

envy666

赞同来自:

如果是比较简单的分词逻辑,可以使用ES自定义分词器的功能实现分词逻辑,不需要体外分词。
如果是复杂的分词,就体外分词后,用特殊的符号作为分隔符重新拼接出这个字段,然后在ES中自定义一个以这个特殊符号为分隔符的分词器,应用于这个字段即可,至于JAVA入库接口是个很基础的东西,看看文档呗

f_on

赞同来自:

在ik 分词的config里面配置自己的远程词典
 

<properties>
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典 -->
<entry key="ext_dict"></entry>
<!--用户可以在这里配置自己的扩展停止词字典-->
<entry key="ext_stopwords"></entry>
<!--用户可以在这里配置远程扩展字典 -->
<entry key="remote_ext_dict">配置自己的远程词典</entry> 
<!--用户可以在这里配置远程扩展停止词字典-->
<!-- <entry key="remote_ext_stopwords">words_location</entry> -->
</properties>

 

laoyang360 - 《一本书讲透Elasticsearch》作者,Elastic认证工程师 [死磕Elasitcsearch]知识星球地址:http://t.cn/RmwM3N9;微信公众号:铭毅天下; 博客:https://elastic.blog.csdn.net

赞同来自:

建议设置自定义分词的规则。
然后写入的时候指定自己设定的规则就可以了。

要回复问题请先登录注册