使用 shuf 来打乱一个文件中的行或是选择文件中一个随机的行。

JDBC导入数据,有字段内容有HTML标签,会影响搜索的效率

Elasticsearch | 作者 berwin | 发布于2016年12月14日 | 阅读数:4260

JDBC导入数据,有字段内容有HTML标签,会影响搜索的效率,有什么好的解决方案吗?
已邀请:

ilangge

赞同来自:

那就去掉html标签啊。

strglee

赞同来自:

这个肯定是有影响的,根据数据量的多少影响多少的问题,html标签没什么价值,但是也分词了。所以建议还是去掉。
es提供了 HTML Strip Char Filter 你可以看一下

要回复问题请先登录注册