看,灰机...
分词

分词

Elasticsearch text类型 怎么进行 模糊查询

Elasticsearchcdcd 回复了问题 • 3 人关注 • 2 个回复 • 2457 次浏览 • 2022-06-21 11:31 • 来自相关话题

都使用一个ik分词器的情况下,想要对不同索引定义不同停用词词典如何做?

Elasticsearchspoofer 回复了问题 • 4 人关注 • 3 个回复 • 4122 次浏览 • 2022-03-11 11:01 • 来自相关话题

index中所有文档的词频统计

Elasticsearchlaoyang360 回复了问题 • 3 人关注 • 1 个回复 • 3726 次浏览 • 2020-08-18 18:43 • 来自相关话题

词库一更新, 索引就得重建, 请问有没有好方法吗

Elasticsearchpolarfox11 回复了问题 • 5 人关注 • 2 个回复 • 4186 次浏览 • 2019-12-16 16:01 • 来自相关话题

不规则的产品编号该如何进行分词呢

Elasticsearchmedcl 回复了问题 • 2 人关注 • 1 个回复 • 3166 次浏览 • 2019-10-16 21:23 • 来自相关话题

分词搜索大字段比较慢,是否能优化

Elasticsearchdoom 回复了问题 • 3 人关注 • 3 个回复 • 2613 次浏览 • 2019-10-08 11:10 • 来自相关话题

邀请参加 Elasticsearch 中文分词器需求调查问卷

Elasticsearchmedcl 发表了文章 • 4 个评论 • 5068 次浏览 • 2019-06-24 20:23 • 来自相关话题

Jietu20190624-202208.gif
 亲爱的 Elasticsearch 中文用户:   为了能够充分了解您对 Elasticsearch 中文分词需求的基本情况,以便我们更有针对性地改进中文分词下的使用体验,并优化相关分词器,请您抽出几分钟的时间填写以下问卷。问卷题目中的选项没有对错之分,请您根据实际情况或想法进行填写。您的信息将被严格保密,请放心填写! 调研结束后,我们将随机抽出 5 名同学,每人送 Elastic 纪念 T 恤一件。谢谢您对本次调查的参与和支持~   问卷填写地址:http://elasticsearch.mikecrm.com/nz0FxmK   谢谢!   以下是 5 位幸运的参与者:  
  • 韦先生 *4270
  • 汪科  *9396
  • 乔驰  *3096
  • 彭先生 *4350
  • 张丽斌 *5329
  再次感谢大家的参与。
Jietu20190624-202208.gif
 亲爱的 Elasticsearch 中文用户:   为了能够充分了解您对 Elasticsearch 中文分词需求的基本情况,以便我们更有针对性地改进中文分词下的使用体验,并优化相关分词器,请您抽出几分钟的时间填写以下问卷。问卷题目中的选项没有对错之分,请您根据实际情况或想法进行填写。您的信息将被严格保密,请放心填写! 调研结束后,我们将随机抽出 5 名同学,每人送 Elastic 纪念 T 恤一件。谢谢您对本次调查的参与和支持~   问卷填写地址:http://elasticsearch.mikecrm.com/nz0FxmK   谢谢!   以下是 5 位幸运的参与者:  
  • 韦先生 *4270
  • 汪科  *9396
  • 乔驰  *3096
  • 彭先生 *4350
  • 张丽斌 *5329
  再次感谢大家的参与。

如%#¥这种特殊符号需要搜索出来应该如何处理

Elasticsearchlaoyang360 回复了问题 • 6 人关注 • 4 个回复 • 7907 次浏览 • 2019-05-30 17:53 • 来自相关话题

ik分词是不是有bug啊?

ElasticsearchGod_lockin 回复了问题 • 2 人关注 • 1 个回复 • 2803 次浏览 • 2019-01-29 16:53 • 来自相关话题

对于ik拼音分词性能影响非常大

Elasticsearchrochy 回复了问题 • 5 人关注 • 3 个回复 • 4554 次浏览 • 2019-01-06 15:07 • 来自相关话题

es aggregation时 聚合字段被拆分

Elasticsearchled3171 回复了问题 • 3 人关注 • 2 个回复 • 7107 次浏览 • 2019-01-04 15:55 • 来自相关话题

关于英文连词问题比如用户搜索iphonex怎么展示iphone x的结果

Elasticsearchrochy 回复了问题 • 3 人关注 • 1 个回复 • 2483 次浏览 • 2018-12-26 17:43 • 来自相关话题

关于ik_max_word配置同义词死循环分词问题

Elasticsearchmedcl 回复了问题 • 6 人关注 • 1 个回复 • 2916 次浏览 • 2018-12-24 10:18 • 来自相关话题

拼音搜索,设置了简拼analyzer,看分词没问题,查询部分词查不到,不知道什么原因?

Elasticsearchmedcl 回复了问题 • 3 人关注 • 1 个回复 • 3366 次浏览 • 2018-12-11 13:23 • 来自相关话题

es配置同义词时,只对分词后最小粒度的词有效,对于组合词,加在ik的扩展词表里起不了作用怎么办?

Elasticsearchrochy 回复了问题 • 3 人关注 • 1 个回复 • 4328 次浏览 • 2018-11-22 21:34 • 来自相关话题

条新动态, 点击查看
kennywu76

kennywu76 回答了问题 • 2018-03-22 12:39 • 4 个回复 不感兴趣

Elasticsearch 分词搜索 - 精确查找

赞同来自:

我觉得1楼和2楼给的方案都可行, 基于关键词的分词和匹配也只能做到这个精准度了。
 
但是我感觉提问者其实想表达的是能否做到语义搜索,也就是说,当用户输入“苹果手机”的时候,人是可以理解其中的语义的,人脑可以将其译成 :

"brand:苹果 AN... 显示全部 »
我觉得1楼和2楼给的方案都可行, 基于关键词的分词和匹配也只能做到这个精准度了。
 
但是我感觉提问者其实想表达的是能否做到语义搜索,也就是说,当用户输入“苹果手机”的时候,人是可以理解其中的语义的,人脑可以将其译成 :

"brand:苹果 AND category:手机"

所以要做到这种智能程度的搜索匹配,只能借助语义分析了。
 
刚好月初去美国参加2018 Elastic{On},看到其中一个国外电商网站实现这类搜索的分享,借助了一个叫做Twiggle的产品,有兴趣的可以参考研究一下:

1906

1907
 

邀请参加 Elasticsearch 中文分词器需求调查问卷

Elasticsearchmedcl 发表了文章 • 4 个评论 • 5068 次浏览 • 2019-06-24 20:23 • 来自相关话题

Jietu20190624-202208.gif
 亲爱的 Elasticsearch 中文用户:   为了能够充分了解您对 Elasticsearch 中文分词需求的基本情况,以便我们更有针对性地改进中文分词下的使用体验,并优化相关分词器,请您抽出几分钟的时间填写以下问卷。问卷题目中的选项没有对错之分,请您根据实际情况或想法进行填写。您的信息将被严格保密,请放心填写! 调研结束后,我们将随机抽出 5 名同学,每人送 Elastic 纪念 T 恤一件。谢谢您对本次调查的参与和支持~   问卷填写地址:http://elasticsearch.mikecrm.com/nz0FxmK   谢谢!   以下是 5 位幸运的参与者:  
  • 韦先生 *4270
  • 汪科  *9396
  • 乔驰  *3096
  • 彭先生 *4350
  • 张丽斌 *5329
  再次感谢大家的参与。
Jietu20190624-202208.gif
 亲爱的 Elasticsearch 中文用户:   为了能够充分了解您对 Elasticsearch 中文分词需求的基本情况,以便我们更有针对性地改进中文分词下的使用体验,并优化相关分词器,请您抽出几分钟的时间填写以下问卷。问卷题目中的选项没有对错之分,请您根据实际情况或想法进行填写。您的信息将被严格保密,请放心填写! 调研结束后,我们将随机抽出 5 名同学,每人送 Elastic 纪念 T 恤一件。谢谢您对本次调查的参与和支持~   问卷填写地址:http://elasticsearch.mikecrm.com/nz0FxmK   谢谢!   以下是 5 位幸运的参与者:  
  • 韦先生 *4270
  • 汪科  *9396
  • 乔驰  *3096
  • 彭先生 *4350
  • 张丽斌 *5329
  再次感谢大家的参与。

Elasticsearch text类型 怎么进行 模糊查询

回复

Elasticsearchcdcd 回复了问题 • 3 人关注 • 2 个回复 • 2457 次浏览 • 2022-06-21 11:31 • 来自相关话题

都使用一个ik分词器的情况下,想要对不同索引定义不同停用词词典如何做?

回复

Elasticsearchspoofer 回复了问题 • 4 人关注 • 3 个回复 • 4122 次浏览 • 2022-03-11 11:01 • 来自相关话题

index中所有文档的词频统计

回复

Elasticsearchlaoyang360 回复了问题 • 3 人关注 • 1 个回复 • 3726 次浏览 • 2020-08-18 18:43 • 来自相关话题

词库一更新, 索引就得重建, 请问有没有好方法吗

回复

Elasticsearchpolarfox11 回复了问题 • 5 人关注 • 2 个回复 • 4186 次浏览 • 2019-12-16 16:01 • 来自相关话题

不规则的产品编号该如何进行分词呢

回复

Elasticsearchmedcl 回复了问题 • 2 人关注 • 1 个回复 • 3166 次浏览 • 2019-10-16 21:23 • 来自相关话题

分词搜索大字段比较慢,是否能优化

回复

Elasticsearchdoom 回复了问题 • 3 人关注 • 3 个回复 • 2613 次浏览 • 2019-10-08 11:10 • 来自相关话题

如%#¥这种特殊符号需要搜索出来应该如何处理

回复

Elasticsearchlaoyang360 回复了问题 • 6 人关注 • 4 个回复 • 7907 次浏览 • 2019-05-30 17:53 • 来自相关话题

ik分词是不是有bug啊?

回复

ElasticsearchGod_lockin 回复了问题 • 2 人关注 • 1 个回复 • 2803 次浏览 • 2019-01-29 16:53 • 来自相关话题

对于ik拼音分词性能影响非常大

回复

Elasticsearchrochy 回复了问题 • 5 人关注 • 3 个回复 • 4554 次浏览 • 2019-01-06 15:07 • 来自相关话题

es aggregation时 聚合字段被拆分

回复

Elasticsearchled3171 回复了问题 • 3 人关注 • 2 个回复 • 7107 次浏览 • 2019-01-04 15:55 • 来自相关话题

关于英文连词问题比如用户搜索iphonex怎么展示iphone x的结果

回复

Elasticsearchrochy 回复了问题 • 3 人关注 • 1 个回复 • 2483 次浏览 • 2018-12-26 17:43 • 来自相关话题

关于ik_max_word配置同义词死循环分词问题

回复

Elasticsearchmedcl 回复了问题 • 6 人关注 • 1 个回复 • 2916 次浏览 • 2018-12-24 10:18 • 来自相关话题

拼音搜索,设置了简拼analyzer,看分词没问题,查询部分词查不到,不知道什么原因?

回复

Elasticsearchmedcl 回复了问题 • 3 人关注 • 1 个回复 • 3366 次浏览 • 2018-12-11 13:23 • 来自相关话题

es配置同义词时,只对分词后最小粒度的词有效,对于组合词,加在ik的扩展词表里起不了作用怎么办?

回复

Elasticsearchrochy 回复了问题 • 3 人关注 • 1 个回复 • 4328 次浏览 • 2018-11-22 21:34 • 来自相关话题

ES是否能实现对词进行加权?即分词后得到的tokens中,对某些tokens加权,使其匹配后得分更高一些

回复

ElasticsearchS_Rainbow 回复了问题 • 4 人关注 • 2 个回复 • 4300 次浏览 • 2018-11-20 16:20 • 来自相关话题

邀请参加 Elasticsearch 中文分词器需求调查问卷

Elasticsearchmedcl 发表了文章 • 4 个评论 • 5068 次浏览 • 2019-06-24 20:23 • 来自相关话题

Jietu20190624-202208.gif
 亲爱的 Elasticsearch 中文用户:   为了能够充分了解您对 Elasticsearch 中文分词需求的基本情况,以便我们更有针对性地改进中文分词下的使用体验,并优化相关分词器,请您抽出几分钟的时间填写以下问卷。问卷题目中的选项没有对错之分,请您根据实际情况或想法进行填写。您的信息将被严格保密,请放心填写! 调研结束后,我们将随机抽出 5 名同学,每人送 Elastic 纪念 T 恤一件。谢谢您对本次调查的参与和支持~   问卷填写地址:http://elasticsearch.mikecrm.com/nz0FxmK   谢谢!   以下是 5 位幸运的参与者:  
  • 韦先生 *4270
  • 汪科  *9396
  • 乔驰  *3096
  • 彭先生 *4350
  • 张丽斌 *5329
  再次感谢大家的参与。
Jietu20190624-202208.gif
 亲爱的 Elasticsearch 中文用户:   为了能够充分了解您对 Elasticsearch 中文分词需求的基本情况,以便我们更有针对性地改进中文分词下的使用体验,并优化相关分词器,请您抽出几分钟的时间填写以下问卷。问卷题目中的选项没有对错之分,请您根据实际情况或想法进行填写。您的信息将被严格保密,请放心填写! 调研结束后,我们将随机抽出 5 名同学,每人送 Elastic 纪念 T 恤一件。谢谢您对本次调查的参与和支持~   问卷填写地址:http://elasticsearch.mikecrm.com/nz0FxmK   谢谢!   以下是 5 位幸运的参与者:  
  • 韦先生 *4270
  • 汪科  *9396
  • 乔驰  *3096
  • 彭先生 *4350
  • 张丽斌 *5329
  再次感谢大家的参与。