好的想法是十分钱一打,真正无价的是能够实现这些想法的人。
ik

ik

ik自定义分词和停用词遇到一个问题, 或者在脚本中如何过滤不想返回的数据呢

回复

Elasticsearcha1667499668 发起了问题 • 1 人关注 • 0 个回复 • 2811 次浏览 • 2023-04-26 18:16 • 来自相关话题

ik+pinyin 实现搜索建议时

Elasticsearchstevelevan 回复了问题 • 5 人关注 • 2 个回复 • 4332 次浏览 • 2022-06-16 10:26 • 来自相关话题

都使用一个ik分词器的情况下,想要对不同索引定义不同停用词词典如何做?

Elasticsearchspoofer 回复了问题 • 4 人关注 • 3 个回复 • 3916 次浏览 • 2022-03-11 11:01 • 来自相关话题

es集群下ik 词库热更新时一致性

ElasticsearchGod_lockin 回复了问题 • 3 人关注 • 2 个回复 • 2622 次浏览 • 2021-06-12 20:23 • 来自相关话题

ik设置远程词库remote_ext_dict无效

ElasticsearchTenaxy 回复了问题 • 6 人关注 • 6 个回复 • 4543 次浏览 • 2020-12-24 22:59 • 来自相关话题

自己写了一个elasticsearch中文分词插件

ElasticsearchBKing 回复了问题 • 4 人关注 • 2 个回复 • 2231 次浏览 • 2020-11-23 04:55 • 来自相关话题

es搜索时字段分词搜索字段分词丢失

Elasticsearchzcc_vv 回复了问题 • 2 人关注 • 1 个回复 • 3183 次浏览 • 2020-05-09 18:12 • 来自相关话题

ik 分词器分词正确 无法命中

Elasticsearchelroy 回复了问题 • 3 人关注 • 2 个回复 • 2500 次浏览 • 2020-04-18 11:00 • 来自相关话题

IK分词的问题

Elasticsearchhapjin 回复了问题 • 3 人关注 • 2 个回复 • 3421 次浏览 • 2020-02-23 11:40 • 来自相关话题

想做城市搜索,麻烦大佬们给个思路

Elasticsearchlaoyang360 回复了问题 • 4 人关注 • 9 个回复 • 3247 次浏览 • 2019-11-11 12:52 • 来自相关话题

使用ik分词,明明分词正确,在查询时无法命中

Elasticsearchmedcl 回复了问题 • 3 人关注 • 1 个回复 • 4027 次浏览 • 2019-03-13 07:38 • 来自相关话题

ik远程扩展字典是不是每次添加词的时候都需要重建索引

Elasticsearchqqq1234567 回复了问题 • 3 人关注 • 2 个回复 • 3310 次浏览 • 2018-11-22 11:46 • 来自相关话题

IK远程字典支持https吗?

Elasticsearchrochy 回复了问题 • 2 人关注 • 1 个回复 • 2253 次浏览 • 2018-10-24 12:47 • 来自相关话题

elasticsearch6.2.4 ik 插件基于数据库热更新词库问题

Elasticsearchzz_hello 回复了问题 • 4 人关注 • 2 个回复 • 4615 次浏览 • 2018-10-09 18:04 • 来自相关话题

动态更新ik词库对集群的影响

Elasticsearchlaoxiong0880 回复了问题 • 7 人关注 • 2 个回复 • 5212 次浏览 • 2018-07-28 09:18 • 来自相关话题

条新动态, 点击查看
直接访问分词器接口,看分词结果 。
浏览器访问
{{{
http://xxxx:9200/_analyze?text=关键词
}}}

或者 命令行
{{{
curl -XGET 'http://xxxx:9200/zh/_analyze?analyzer=... 显示全部 »
直接访问分词器接口,看分词结果 。
浏览器访问
{{{
http://xxxx:9200/_analyze?text=关键词
}}}

或者 命令行
{{{
curl -XGET 'http://xxxx:9200/zh/_analyze?analyzer=ik_syno&pretty' -d '关键词'
}}}
1.不同的分词会产生不同的分词结果,max_word产生的词位置有重叠;smart不会有位置重叠;
2.查询条件加引号,查询处理的时候,会将引号内的查询关键字作为一个整体,重写为 phrase 查询;

索引:中国人民银行 -> 中国人民银行 中国人... 显示全部 »
1.不同的分词会产生不同的分词结果,max_word产生的词位置有重叠;smart不会有位置重叠;
2.查询条件加引号,查询处理的时候,会将引号内的查询关键字作为一个整体,重写为 phrase 查询;

索引:中国人民银行 -> 中国人民银行 中国人民 中国人 中国 国人人民银行 人民 银行 银 行
查询:"\"中国人 中国\""-> "中国人 中国 国人 中国" ,是一个Phrase查询。

 
关键点在于查询展开之后,附加了一个“中国”,这个中国是带有位置属性的(phrase),而在索引里面,是没有两个“中国”的,即需要保证先出现一个“中国人”,然后“中国”,再出现一个“国人”,再出现一个“中国”,所以命中不了,有 4 个term要出现,且满足一个大概的位置,当然,可以通过 slop 设置位置的跳跃。
 
你要是把索引数据改成:“中国人民银行 中国”,就能查出来。
  
 
kennywu76

kennywu76 回答了问题 • 2018-03-22 12:39 • 4 个回复 不感兴趣

Elasticsearch 分词搜索 - 精确查找

赞同来自:

我觉得1楼和2楼给的方案都可行, 基于关键词的分词和匹配也只能做到这个精准度了。
 
但是我感觉提问者其实想表达的是能否做到语义搜索,也就是说,当用户输入“苹果手机”的时候,人是可以理解其中的语义的,人脑可以将其译成 :

"brand:苹果 AN... 显示全部 »
我觉得1楼和2楼给的方案都可行, 基于关键词的分词和匹配也只能做到这个精准度了。
 
但是我感觉提问者其实想表达的是能否做到语义搜索,也就是说,当用户输入“苹果手机”的时候,人是可以理解其中的语义的,人脑可以将其译成 :

"brand:苹果 AND category:手机"

所以要做到这种智能程度的搜索匹配,只能借助语义分析了。
 
刚好月初去美国参加2018 Elastic{On},看到其中一个国外电商网站实现这类搜索的分享,借助了一个叫做Twiggle的产品,有兴趣的可以参考研究一下:

1906

1907
 

ik自定义分词和停用词遇到一个问题, 或者在脚本中如何过滤不想返回的数据呢

回复

Elasticsearcha1667499668 发起了问题 • 1 人关注 • 0 个回复 • 2811 次浏览 • 2023-04-26 18:16 • 来自相关话题

ik+pinyin 实现搜索建议时

回复

Elasticsearchstevelevan 回复了问题 • 5 人关注 • 2 个回复 • 4332 次浏览 • 2022-06-16 10:26 • 来自相关话题

都使用一个ik分词器的情况下,想要对不同索引定义不同停用词词典如何做?

回复

Elasticsearchspoofer 回复了问题 • 4 人关注 • 3 个回复 • 3916 次浏览 • 2022-03-11 11:01 • 来自相关话题

es集群下ik 词库热更新时一致性

回复

ElasticsearchGod_lockin 回复了问题 • 3 人关注 • 2 个回复 • 2622 次浏览 • 2021-06-12 20:23 • 来自相关话题

ik设置远程词库remote_ext_dict无效

回复

ElasticsearchTenaxy 回复了问题 • 6 人关注 • 6 个回复 • 4543 次浏览 • 2020-12-24 22:59 • 来自相关话题

自己写了一个elasticsearch中文分词插件

回复

ElasticsearchBKing 回复了问题 • 4 人关注 • 2 个回复 • 2231 次浏览 • 2020-11-23 04:55 • 来自相关话题

es搜索时字段分词搜索字段分词丢失

回复

Elasticsearchzcc_vv 回复了问题 • 2 人关注 • 1 个回复 • 3183 次浏览 • 2020-05-09 18:12 • 来自相关话题

ik 分词器分词正确 无法命中

回复

Elasticsearchelroy 回复了问题 • 3 人关注 • 2 个回复 • 2500 次浏览 • 2020-04-18 11:00 • 来自相关话题

IK分词的问题

回复

Elasticsearchhapjin 回复了问题 • 3 人关注 • 2 个回复 • 3421 次浏览 • 2020-02-23 11:40 • 来自相关话题

想做城市搜索,麻烦大佬们给个思路

回复

Elasticsearchlaoyang360 回复了问题 • 4 人关注 • 9 个回复 • 3247 次浏览 • 2019-11-11 12:52 • 来自相关话题

使用ik分词,明明分词正确,在查询时无法命中

回复

Elasticsearchmedcl 回复了问题 • 3 人关注 • 1 个回复 • 4027 次浏览 • 2019-03-13 07:38 • 来自相关话题

ik远程扩展字典是不是每次添加词的时候都需要重建索引

回复

Elasticsearchqqq1234567 回复了问题 • 3 人关注 • 2 个回复 • 3310 次浏览 • 2018-11-22 11:46 • 来自相关话题

IK远程字典支持https吗?

回复

Elasticsearchrochy 回复了问题 • 2 人关注 • 1 个回复 • 2253 次浏览 • 2018-10-24 12:47 • 来自相关话题

elasticsearch6.2.4 ik 插件基于数据库热更新词库问题

回复

Elasticsearchzz_hello 回复了问题 • 4 人关注 • 2 个回复 • 4615 次浏览 • 2018-10-09 18:04 • 来自相关话题

动态更新ik词库对集群的影响

回复

Elasticsearchlaoxiong0880 回复了问题 • 7 人关注 • 2 个回复 • 5212 次浏览 • 2018-07-28 09:18 • 来自相关话题

elasticsearch-analysis-ik和elasticsearch-analysis-mmseg更新至1.7.0

资讯动态medcl 发表了文章 • 3 个评论 • 5391 次浏览 • 2016-01-13 11:20 • 来自相关话题

elasticsearch-analysis-ik: https://github.com/medcl/elasticsearch-analysis-ik   elasticsearch-analysis-mmseg:  https://github.com/medcl/elast ... -mseg   主要更新配置文件存放路径,之前版本的配置文件存放在elasticsearch的config目录,现在都修改为插件的相对目录了,主要是简化部署,现在可在Found(https://found.elastic.co)部署了。
elasticsearch-analysis-ik: https://github.com/medcl/elasticsearch-analysis-ik   elasticsearch-analysis-mmseg:  https://github.com/medcl/elast ... -mseg   主要更新配置文件存放路径,之前版本的配置文件存放在elasticsearch的config目录,现在都修改为插件的相对目录了,主要是简化部署,现在可在Found(https://found.elastic.co)部署了。