求指点,7.10.2版本elasticsearch如何修改默认搜索分词工具为hanlp
Elasticsearch | 作者 sihaixianren | 发布于2021年02月25日 | 阅读数:1584
我在centis7上部署了elasticsearch 7.10.2并且安装了hanlp分词工具,现在搜索默认并没有使用hanlp分词。
GET _analyze
{
"text": "美国"
}
返回
{
"tokens" : [
{
"token" : "美",
"start_offset" : 0,
"end_offset" : 1,
"type" : "<IDEOGRAPHIC>",
"position" : 0
},
{
"token" : "国",
"start_offset" : 1,
"end_offset" : 2,
"type" : "<IDEOGRAPHIC>",
"position" : 1
}
]
}
我希望输入
GET _analyze
{
"text": "美国"
}
返回
{
"tokens" : [
{
"token" : "美国",
"start_offset" : 0,
"end_offset" : 2,
"type" : "nsf",
"position" : 0
}
]
}
现在我输入
GET _analyze
{
"text": "美国","tokenizer": "hanlp"
}
已经可以返回
{
"tokens" : [
{
"token" : "美国",
"start_offset" : 0,
"end_offset" : 2,
"type" : "nsf",
"position" : 0
}
]
}
我希望可以省去"tokenizer": "hanlp"部分
GET _analyze
{
"text": "美国"
}
返回
{
"tokens" : [
{
"token" : "美",
"start_offset" : 0,
"end_offset" : 1,
"type" : "<IDEOGRAPHIC>",
"position" : 0
},
{
"token" : "国",
"start_offset" : 1,
"end_offset" : 2,
"type" : "<IDEOGRAPHIC>",
"position" : 1
}
]
}
我希望输入
GET _analyze
{
"text": "美国"
}
返回
{
"tokens" : [
{
"token" : "美国",
"start_offset" : 0,
"end_offset" : 2,
"type" : "nsf",
"position" : 0
}
]
}
现在我输入
GET _analyze
{
"text": "美国","tokenizer": "hanlp"
}
已经可以返回
{
"tokens" : [
{
"token" : "美国",
"start_offset" : 0,
"end_offset" : 2,
"type" : "nsf",
"position" : 0
}
]
}
我希望可以省去"tokenizer": "hanlp"部分
1 个回复
anning19890402
赞同来自: