你的浏览器禁用了JavaScript, 请开启后刷新浏览器获得更好的体验!
输入关键字进行搜索
搜索:
发现
分享
文章
活动
登录
使用 nohup 或 disown 如果你要让某个进程运行在后台。
关于分词干预问题
Elasticsearch
| 作者
liubin
| 发布于2018年12月06日 | 阅读数:
1838
分享到:
QQ空间
新浪微博
微信
QQ好友
印象笔记
有道云笔记
由于ik分词词库有省市区的次元,现在需求是比如文本是四川省成都市钉钉火锅店,用的ik_smart, 四川省,和成都市 分成了完整词,在不考虑ik_max_word ,情况下,能否干预ik_smart. 拆除省市区县的。分词四川 + 省, 成都+市,
没有找到相关结果
已邀请:
与内容相关的链接
提交
1 个回复
rochy
-
rochy_he
赞同来自:
修改 ik 的词典即可,不过工作量挺大的;
推荐自己根据 ik_smart 的结果做一层处理即可
可以使用 Pattern Capture Token Filter 对结果进行处理
https://www.elastic.co/guide/e ... .html
要回复问题请先
登录
或
注册
发起人
liubin
活动推荐
Jun
17
搜索客 Meetup 讲师招募(长期有效)
线上
·
6-17 周一
·
进行中
Nov
30
【活动报名】ClickHouse Beijing User Group 第2届 Meetup
北京
·
11-30 周六
·
报名中
相关问题
这个问题有点难?
怎么解决elasticsearch集群占用太多虚拟内存(VIRT)的问题?占用了几十个G,有什么可以对它进行限制的相关设置吗?
集群稳定性的一些问题(一定量数据后集群变得迟钝)
elasticsearch functionScoreQuery scriptFunction效率问题
除了设置mapping为not analyzied,还有其他方法让一个string字段不分词吗?
Elasticsearch查询时指定分词器
关于单个机器分片数容量问题
logstash获取时间的问题
索引某个shard无法恢复的问题
es scroll查询全部数据问题
elasticsearch 中的store 以及倒排索引的问题
问题状态
最新活动:
2018-12-06 15:34
浏览:
1838
关注:
3
人
1 个回复
rochy - rochy_he
赞同来自:
推荐自己根据 ik_smart 的结果做一层处理即可
可以使用 Pattern Capture Token Filter 对结果进行处理
https://www.elastic.co/guide/e ... .html