不为失败找理由,要为成功找方法。

拼音分词器问题-获取“带字母的短语”的拼音前缀

Elasticsearch | 作者 zhanghuangel | 发布于2016年03月09日 | 阅读数:4811

您好。 用您写的拼音分词器v1 .3 .0, es版本1 .7 .2。

以下定义的是获取汉字的拼音前缀
prefix_pinyin_analyzer:
    tokenizer: prefix_pinyin_tokenizer
    filter: [lowercase, word_delimiter]

prefix_pinyin_tokenizer:
    type: pinyin
    padding_char: ""
    first_letter: only

执行分析语句:
GET / suggest_idx_1 / _analyze ? analyzer = prefix_pinyin_analyzer {
    "text": "A快递"
}
预计结果是 "akd",
但结果是: "kkd"。
请问怎么处理? {
    "tokens": [{
        "token": "text",
        "start_offset": 5,
        "end_offset": 9,
        "type": "word",
        "position": 1
    }, {
        "token": "kkd",
        "start_offset": 12,
        "end_offset": 15,
        "type": "word",
        "position": 2
    }]
}
已邀请:

medcl - 今晚打老虎。

赞同来自:

我在最新的版本上测试是ok的,这个版本可能是有bug,你能升级到最新的么?
GET test1/_analyze
{
"text":"A快递",
"analyzer":"pinyin_first_letter"
}

{
"tokens": [
{
"token": "Akd",
"start_offset": 0,
"end_offset": 3,
"type": "word",
"position": 0
}
]
}

chennanlcy - elasticsearch爱好者

赞同来自:

推荐一个更好用的拼音插件:http://blog.csdn.net/chennanym ... 36368

要回复问题请先登录注册