使用Java查询 elasticsearch提示远程连接关闭
medcl 回复了问题 • 2 人关注 • 1 个回复 • 9672 次浏览 • 2016-10-19 23:32
ES索引下每条记录ID自增长问题
匿名用户 回复了问题 • 3 人关注 • 2 个回复 • 14085 次浏览 • 2016-10-15 10:46
关于 elasticsearch cluster 各角色和logstash 写数据的问题
weizijun 回复了问题 • 3 人关注 • 1 个回复 • 5525 次浏览 • 2016-10-14 13:43
Elasticsearch 主分片丢失后大量INITIALIZING_SHARDS堆积如何恢复
weizijun 回复了问题 • 5 人关注 • 1 个回复 • 9980 次浏览 • 2016-10-14 13:39
elasticsearch-analysis-pinyin更新至es2.4.1和5.0.0-rc1
medcl 发表了文章 • 3 个评论 • 4380 次浏览 • 2016-10-13 21:49
新增若干特性,支持多种选项配置,支持 pinyin 的切分,比之前需要结合 ngram 的方式更加准确,
如:liudehuaalibaba13zhuanghan->liu,de,hua,a,li,ba,ba,13,zhuang,han,
具体配置参加文档:
https://github.com/medcl/elast ... inyin
下载:
https://github.com/medcl/elast ... eases
欢迎测试:
curl -XPUT http://localhost:9200/medcl/ -d'
{
"index" : {
"analysis" : {
"analyzer" : {
"pinyin_analyzer" : {
"tokenizer" : "my_pinyin"
}
},
"tokenizer" : {
"my_pinyin" : {
"type" : "pinyin",
"keep_separate_first_letter" : false,
"keep_full_pinyin" : true,
"keep_original" : false,
"limit_first_letter_length" : 16,
"lowercase" : true
}
}
}
}
}'
curl http://localhost:9200/medcl/_a ... lyzer
{
"tokens" : [ {
"token" : "liu",
"start_offset" : 0,
"end_offset" : 1,
"type" : "word",
"position" : 0
}, {
"token" : "de",
"start_offset" : 1,
"end_offset" : 2,
"type" : "word",
"position" : 1
}, {
"token" : "hua",
"start_offset" : 2,
"end_offset" : 3,
"type" : "word",
"position" : 2
}, {
"token" : "a",
"start_offset" : 2,
"end_offset" : 31,
"type" : "word",
"position" : 3
}, {
"token" : "b",
"start_offset" : 2,
"end_offset" : 31,
"type" : "word",
"position" : 4
}, {
"token" : "c",
"start_offset" : 2,
"end_offset" : 31,
"type" : "word",
"position" : 5
}, {
"token" : "d",
"start_offset" : 2,
"end_offset" : 31,
"type" : "word",
"position" : 6
}, {
"token" : "liu",
"start_offset" : 2,
"end_offset" : 31,
"type" : "word",
"position" : 7
}, {
"token" : "de",
"start_offset" : 2,
"end_offset" : 31,
"type" : "word",
"position" : 8
}, {
"token" : "hua",
"start_offset" : 2,
"end_offset" : 31,
"type" : "word",
"position" : 9
}, {
"token" : "wo",
"start_offset" : 2,
"end_offset" : 31,
"type" : "word",
"position" : 10
}, {
"token" : "bu",
"start_offset" : 2,
"end_offset" : 31,
"type" : "word",
"position" : 11
}, {
"token" : "zhi",
"start_offset" : 2,
"end_offset" : 31,
"type" : "word",
"position" : 12
}, {
"token" : "dao",
"start_offset" : 2,
"end_offset" : 31,
"type" : "word",
"position" : 13
}, {
"token" : "shi",
"start_offset" : 2,
"end_offset" : 31,
"type" : "word",
"position" : 14
}, {
"token" : "shui",
"start_offset" : 2,
"end_offset" : 31,
"type" : "word",
"position" : 15
}, {
"token" : "ldhabcdliudehuaw",
"start_offset" : 0,
"end_offset" : 16,
"type" : "word",
"position" : 16
} ]
}
elasticsearch去重的问题
pqy 回复了问题 • 6 人关注 • 4 个回复 • 13122 次浏览 • 2017-05-03 11:26
java client 和 http restful 底层实现是一样的么?哪个更好一些呢
flowaters 回复了问题 • 7 人关注 • 6 个回复 • 6927 次浏览 • 2016-10-15 10:54
IK分词后对搜索英文、数字的影响,搜索不出来?
martindu 回复了问题 • 2 人关注 • 1 个回复 • 16326 次浏览 • 2016-10-13 17:48
不分词建好了索引,上亿条数据,我现在想加入分词,是不是只能重新建?
martindu 回复了问题 • 2 人关注 • 1 个回复 • 4559 次浏览 • 2016-10-12 17:26
用elasticsearch搭建的上亿的数据,分词了不能精确查询,不分词不能模糊查询,系统就是这样吗?
pingyuan 回复了问题 • 2 人关注 • 3 个回复 • 10907 次浏览 • 2016-11-14 20:03
BulkProcessor 无响应
medcl 回复了问题 • 2 人关注 • 1 个回复 • 6036 次浏览 • 2016-10-21 22:56