ik
ik自定义分词和停用词遇到一个问题, 或者在脚本中如何过滤不想返回的数据呢
回复Elasticsearch • a1667499668 发起了问题 • 1 人关注 • 0 个回复 • 3002 次浏览 • 2023-04-26 18:16
ik+pinyin 实现搜索建议时
Elasticsearch • stevelevan 回复了问题 • 5 人关注 • 2 个回复 • 4503 次浏览 • 2022-06-16 10:26
都使用一个ik分词器的情况下,想要对不同索引定义不同停用词词典如何做?
Elasticsearch • spoofer 回复了问题 • 4 人关注 • 3 个回复 • 4120 次浏览 • 2022-03-11 11:01
es集群下ik 词库热更新时一致性
Elasticsearch • God_lockin 回复了问题 • 3 人关注 • 2 个回复 • 2804 次浏览 • 2021-06-12 20:23
ik设置远程词库remote_ext_dict无效
Elasticsearch • Tenaxy 回复了问题 • 6 人关注 • 6 个回复 • 4780 次浏览 • 2020-12-24 22:59
自己写了一个elasticsearch中文分词插件
Elasticsearch • BKing 回复了问题 • 4 人关注 • 2 个回复 • 2398 次浏览 • 2020-11-23 04:55
es搜索时字段分词搜索字段分词丢失
Elasticsearch • zcc_vv 回复了问题 • 2 人关注 • 1 个回复 • 3376 次浏览 • 2020-05-09 18:12
ik 分词器分词正确 无法命中
Elasticsearch • elroy 回复了问题 • 3 人关注 • 2 个回复 • 2677 次浏览 • 2020-04-18 11:00
IK分词的问题
Elasticsearch • hapjin 回复了问题 • 3 人关注 • 2 个回复 • 3604 次浏览 • 2020-02-23 11:40
想做城市搜索,麻烦大佬们给个思路
Elasticsearch • laoyang360 回复了问题 • 4 人关注 • 9 个回复 • 3431 次浏览 • 2019-11-11 12:52
使用ik分词,明明分词正确,在查询时无法命中
Elasticsearch • medcl 回复了问题 • 3 人关注 • 1 个回复 • 4236 次浏览 • 2019-03-13 07:38
ik远程扩展字典是不是每次添加词的时候都需要重建索引
Elasticsearch • qqq1234567 回复了问题 • 3 人关注 • 2 个回复 • 3480 次浏览 • 2018-11-22 11:46
IK远程字典支持https吗?
Elasticsearch • rochy 回复了问题 • 2 人关注 • 1 个回复 • 2429 次浏览 • 2018-10-24 12:47
elasticsearch6.2.4 ik 插件基于数据库热更新词库问题
Elasticsearch • zz_hello 回复了问题 • 4 人关注 • 2 个回复 • 4793 次浏览 • 2018-10-09 18:04
动态更新ik词库对集群的影响
Elasticsearch • laoxiong0880 回复了问题 • 7 人关注 • 2 个回复 • 5392 次浏览 • 2018-07-28 09:18
浏览器访问
{{{
http://xxxx:9200/_analyze?text=关键词
}}}
或者 命令行
{{{
curl -XGET 'http://xxxx:9200/zh/_analyze?analyzer=... 显示全部 »
浏览器访问
{{{
http://xxxx:9200/_analyze?text=关键词
}}}
或者 命令行
{{{
curl -XGET 'http://xxxx:9200/zh/_analyze?analyzer=ik_syno&pretty' -d '关键词'
}}}
2.查询条件加引号,查询处理的时候,会将引号内的查询关键字作为一个整体,重写为 phrase 查询;
索引:中国人民银行 -> 中国人民银行 中国人... 显示全部 »
2.查询条件加引号,查询处理的时候,会将引号内的查询关键字作为一个整体,重写为 phrase 查询;
索引:中国人民银行 -> 中国人民银行 中国人民 中国人 中国 国人人民银行 人民 银行 银 行
查询:"\"中国人 中国\""-> "中国人 中国 国人 中国" ,是一个Phrase查询。
关键点在于查询展开之后,附加了一个“中国”,这个中国是带有位置属性的(phrase),而在索引里面,是没有两个“中国”的,即需要保证先出现一个“中国人”,然后“中国”,再出现一个“国人”,再出现一个“中国”,所以命中不了,有 4 个term要出现,且满足一个大概的位置,当然,可以通过 slop 设置位置的跳跃。
你要是把索引数据改成:“中国人民银行 中国”,就能查出来。
但是我感觉提问者其实想表达的是能否做到语义搜索,也就是说,当用户输入“苹果手机”的时候,人是可以理解其中的语义的,人脑可以将其译成 :
"brand:苹果 AN... 显示全部 »
但是我感觉提问者其实想表达的是能否做到语义搜索,也就是说,当用户输入“苹果手机”的时候,人是可以理解其中的语义的,人脑可以将其译成 :
"brand:苹果 AND category:手机"
所以要做到这种智能程度的搜索匹配,只能借助语义分析了。
刚好月初去美国参加2018 Elastic{On},看到其中一个国外电商网站实现这类搜索的分享,借助了一个叫做Twiggle的产品,有兴趣的可以参考研究一下:
1906
1907
ik自定义分词和停用词遇到一个问题, 或者在脚本中如何过滤不想返回的数据呢
回复Elasticsearch • a1667499668 发起了问题 • 1 人关注 • 0 个回复 • 3002 次浏览 • 2023-04-26 18:16
都使用一个ik分词器的情况下,想要对不同索引定义不同停用词词典如何做?
回复Elasticsearch • spoofer 回复了问题 • 4 人关注 • 3 个回复 • 4120 次浏览 • 2022-03-11 11:01
ik设置远程词库remote_ext_dict无效
回复Elasticsearch • Tenaxy 回复了问题 • 6 人关注 • 6 个回复 • 4780 次浏览 • 2020-12-24 22:59
自己写了一个elasticsearch中文分词插件
回复Elasticsearch • BKing 回复了问题 • 4 人关注 • 2 个回复 • 2398 次浏览 • 2020-11-23 04:55
ik远程扩展字典是不是每次添加词的时候都需要重建索引
回复Elasticsearch • qqq1234567 回复了问题 • 3 人关注 • 2 个回复 • 3480 次浏览 • 2018-11-22 11:46
elasticsearch6.2.4 ik 插件基于数据库热更新词库问题
回复Elasticsearch • zz_hello 回复了问题 • 4 人关注 • 2 个回复 • 4793 次浏览 • 2018-10-09 18:04
elasticsearch-analysis-ik和elasticsearch-analysis-mmseg更新至1.7.0
资讯动态 • medcl 发表了文章 • 3 个评论 • 5489 次浏览 • 2016-01-13 11:20