请教一个关于es中文聚合查询 Fielddata is disabled on text 出现的问题

Elasticsearch | 作者 a2615381 | 发布于2019年01月05日 | 阅读数：7995

我有一个类似group by的需求场景，是吧一个中文分词字段进行去重，然后得到每个有多少个
使用了AggregationBuilder 工具，再对不分词字段，挺正常的，可以使用
但是使用在中文分词字段则会报错，内容如下
{"error":{"root_cause":[{"type":"illegal_argument_exception","reason":"Fielddata is disabled on text
fields by default. Set fielddata=true on [name] in order to load fielddata in memory by uninverting the
inverted index. Note that this can however use significant memory. Alternatively use a keyword field
instead."}],"type":"search_phase_execution_exception","reason":"all shards failed","phase":"query",
"grouped":true,"failed_shards":[{"shard":0,"index":"school","node":"H7VIRoOwS8mws78T-0Ce-Q","reason":{
"type":"illegal_argument_exception","reason":"Fielddata is disabled on text fields by default. Set
fielddata=true on [name] in order to load fielddata in memory by uninverting the inverted index.Note that
this can however use significant memory. Alternatively use a keyword field instead."}}]},"status":400}

查询资料发现是因为分词问题，网上给出的解决办法是2个
1 ，这是region这个排序字段的fileddata为true。但是这个方法很不推荐，会占用大量内存
2 ，查询时候增加字段值 .keyword 。如下
AggregationBuilder aggregationBuilder =
AggregationBuilders.terms("nameAgg").field("name.keyword").size(Integer.MAX_VALUE) //1
.subAggregation(AggregationBuilders.terms("jobAgg").field("job.keyword").size(Integer.MAX_VALUE) //2
.subAggregation(AggregationBuilders.avg("ageAgg").field("age")) //3
.subAggregation(AggregationBuilders.count("totalNum").field("name.keyword"))); //4

searchSourceBuilder.aggregation(aggregationBuilder);

但是我增加了 keyword之后发现，只是不报错了。但是值是空的，请问怎么解决

4 个回复

rochy - rochy_he

赞同来自: a2615381

请把 name 字段的 mapping 信息贴一下

匿名用户

"mappings": {"modeldata": {
"properties": {
"brandName": {
"search_analyzer": "query_ansj",
"analyzer": "index_ansj",
"type": "text"
},
"color": {
"search_analyzer": "query_ansj",
"analyzer": "index_ansj",
"type": "text"
},
"typeFourId": {
"type": "integer"
},
"modelAttr": {
"index": false,
"type": "text"
},
"modelId": {
"type": "long"
},
"seriesName": {
"search_analyzer": "query_ansj",
"analyzer": "index_ansj",
"type": "text"
},

大概就是这样了

laoyang360 - 《一本书讲透Elasticsearch》作者，Elastic认证工程师 [死磕Elasitcsearch]知识星球地址：http://t.cn/RmwM3N9；微信公众号：铭毅天下; 博客：https://elastic.blog.csdn.net

如果你的keyword针对一很长的content，如网页正文内容，聚合肯定结果为空的。

a2615381

自我解决问题，
修改查询字段 mapping，增加多属性 keyword

curl -XPUT localhost:9200/my_index/my_type/_mapping -d '
{
"my_type": {
"properties": {
"fName": {
"type": "text",
"search_analyzer": "query_ansj",
"analyzer": "index_ansj",
"fields": {
"raw": {
"type": "keyword"
}
}
}
}
}
}'

查询代码
SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder(); TermsAggregationBuilder aggHouse=AggregationBuilders.terms("modelNameAgg").field("fName.raw").size(10); searchSourceBuilder.aggregation(aggHouse); Search search = new Search.Builder(searchSourceBuilder.toString()).addIndex(es.getEsIndex()).addType(es.getEsType()).build(); SearchResult searchResult = js.execute(search); List<TermsAggregation.Entry> nameAgg = searchResult.getAggregations().getTermsAggregation("modelNameAgg").getBuckets();

但是仅限于修改之后增加的数据或者修改的数据，旧数据无法聚合，因为索引没有建立吧。也能理解，
重刷一遍数据就好了

要回复问题请先登录或注册

请教一个关于es中文聚合查询 Fielddata is disabled on text 出现的问题

4 个回复

发起人

活动推荐

相关问题

问题状态

请教一个关于es中文 聚合查询 Fielddata is disabled on text 出现的问题

与内容相关的链接

4 个回复

发起人

活动推荐

相关问题

问题状态

请教一个关于es中文聚合查询 Fielddata is disabled on text 出现的问题