找到问题的解决办法了么?

初用elasticsearch的困惑

Elasticsearch | 作者 yydzcr | 发布于2017年07月19日 | 阅读数:1928

使用elasticsearch小白有几个问题,希望大佬能回答:
1.数据分类是使用_index还是type?
例如:全国数据,按省分类。是分_index好还是type,感觉两者没有什么太大的区别。
2.数据bulk写入
使用语句
curl -XPOST 'localhost:9200/_bulk?pretty' -H 'Content-Type: application/json'  --data-binary @file
每个文档只能是10m左右,大了会报错?不知道原因。
3.数据更新
是用某个唯一字段去比对全库?然后去更新么?
4.搜索准确性
类似京东这种词只能给切词加字典了么?不然会匹配的北京东城。
或者说【电话销售】,【电销】,匹配或关系,但是,默认切词会切成【电话】,【销售】,【电销】去匹配。是不是也只能加入字典?但是这类宽泛的词态多了。不能碰到一个,字典里加一个,这样体验不好吧?
 
以上就是一个小白的困惑。先写过大家了。
已邀请:

laoyang360 - 《一本书讲透Elasticsearch》作者,Elastic认证工程师 [死磕Elasitcsearch]知识星球地址:http://t.cn/RmwM3N9;微信公众号:铭毅天下; 博客:https://elastic.blog.csdn.net

赞同来自: jnuc093 toxindr

1 用index,type是es设计缺陷,新版本可能去掉。
原本设计es 中,index代表关系型数据库中的数据库,type代表库表。现在我们应用中index代表库表的居多。
2,批量操作量大,不行就自己写程序实现,遍历,解析,插入即可。
3,更新id就可以。
4,用ik分词即可。设置好mapping

BrickXu - BlackOps@Qunar

赞同来自:

1. https://www.elastic.co/blog/index-vs-type   把这个看一遍就了解了,另外5.5+/6.0都要把type干掉了,所以尽量别用type了。
 
2. 报错贴一下。

要回复问题请先登录注册