在 Mapping 里面,将 dynamic 参数设置成 strict 可以拒绝索引包含未知字段的文档。 此条 Tips 由 medcl 贡献。

海量科技股份有限公司ES中文插件

Elasticsearch | 作者 novia | 发布于2018年11月19日 | | 阅读数:1297

海量分词是天津海量信息技术股份有限公司自主研发的中文分词核心,已于2018年7月将分词5.0版免费开放,欢迎试用。
 
海量分词演示界面 http://www.hailiangxinxi.com/smartCenter2018/index

另外,海量提供免费API接口,文档详见http://www.hailiangxinxi.com/smartCenter2018/doc,欢迎大家试用,如有疑问,请联系nlp@hylanda.com

Analyzer: hlseg_search , hlseg_large , hlseg_normal, Tokenizer: hlseg_search , hlseg_large , hlseg_normal
 
github地址:https://github.com/HylandaOpen ... ME.md

[尊重社区原创,转载请保留或注明出处]
本文地址:http://elasticsearch.cn/article/6145


6 个评论

不错不错,效果可以
试了下。效果不错。赞一个。
请问一下贵公司的词库是使用新词发现程序在大语料的情况下获得的么?
novia

novia 回复 rochy

一部分新出现的词是,历史的就不是了
rochy

rochy 回复 novia

质量上有专人把关么,我看里面有一些是不成词的
novia

novia 回复 rochy

不好意思,公司有专门的人搞这块。不知道你方不方便和她直接交流。如果不方便我帮你转问...

或者你有没有实际不成词的例子,我让我们同事分析下

要回复文章请先登录注册