使用elasticsearch对其他数据源进行索引时，如何选用分词器？

Elasticsearch | 作者 ggchangan | 发布于2015年12月11日 | 阅读数：5909

其他数据源包括关系数据库mysql，sqlserver等；非关系数据库redis等；文档、网页、视频等；关系数据库中的每条记录映射成es中的一个文档，这样因为数据源的多样性，无法确定文档的语言。
当前使用的解决方案是：使用标准的分词器，不考虑数据来源的语言。这样的一个问题就是中文被分成单个字，没有词的概念。不知这样做怎么样？有没有更好的解决方案？