是时候用 ES 拯救发际线啦

ElasticSearch中的id可以为中文嘛?

Elasticsearchrochy 回复了问题 • 2 人关注 • 1 个回复 • 1144 次浏览 • 2018-11-15 11:54 • 来自相关话题

ES 6.4.3 X-PACK 启用安装配置

经验分享zqc0512 发表了文章 • 6 个评论 • 11899 次浏览 • 2018-11-15 09:27 • 来自相关话题

由于 ES开源了X-PACK代码,现在6.4.3版本与6.3以及以下的有变化
我基于最新的版本整理了下启用X-PACK功能。坑比较多,给我的感觉与searchguard 搞得越来越像了……
比较坑的是 transport(9300) 必须要用SSL…… 大家注意下。 6比5复杂多了……
 
Configure each node to:
Required: Enable TLS on the transport layer.
Recommended: Enable TLS on the HTTP layer.

 
参考:
https://www.elastic.co/guide/e ... .html
  1. ES 设置
  2. 配置 TLS/SSL
  3. 配置ES(x-pack认证)
  4. 启动ES
  5. 配置密码
  6. 配置kibana

 1 Elasticsearch.yml 文件添加内容
xpack.security.enabled: true
2 .1生成CA证书
./elasticsearch-certutil ca
2.2 生成客户端证书
./elasticsearch-certutil cert --ca
2.3ES启用SSL配置文件
xpack.security.transport.ssl.verification_mode: certificate
xpack.security.transport.ssl.keystore.path: xxx.p12
xpack.security.transport.ssl.truststore.path: xxx.p12
2.4 keystore 添加内容
./elasticsearch-keystore add xpack.security.transport.ssl.keystore.secure_password
3启用相关功能


xpack.monitoring.enabled: true
xpack.graph.enabled: true
xpack.ml.enabled: true
xpack.security.enabled: true
xpack.watcher.enabled: true
xpack.security.authc.accept_default_password: false
xpack.security.transport.ssl.enabled: true
xpack.monitoring.collection.cluster.stats.timeout: 30m
xpack.monitoring.collection.index.stats.timeout: 30m
xpack.monitoring.collection.index.recovery.active_only: true
xpack.monitoring.collection.index.recovery.timeout: 30m
xpack.monitoring.history.duration: 3650d


4 启动ES
./elasticsearch -d 每台
5配置密码
./elasticsearch-setup-passwords
 6汉化kibana 这玩意我还没有整理完,5差不多搞完了。
7开始浪

6版本
无标题1.png

5版本

无标题4.png


无标题2.png


无标题3.png

query_string查询多值字段问题请教

Elasticsearchhello3521 回复了问题 • 7 人关注 • 6 个回复 • 7268 次浏览 • 2018-11-14 17:44 • 来自相关话题

filebeat读文件,不能识别尖括号内的内容吗?

Beatszqc0512 回复了问题 • 2 人关注 • 1 个回复 • 1443 次浏览 • 2018-11-14 17:11 • 来自相关话题

kibana使用reporting功能时报错

Kibanazqc0512 回复了问题 • 2 人关注 • 1 个回复 • 3233 次浏览 • 2018-11-14 17:01 • 来自相关话题

search_template支持高亮吗?高亮无效

Elasticsearchrochy 回复了问题 • 3 人关注 • 1 个回复 • 2256 次浏览 • 2018-11-14 15:36 • 来自相关话题

【 报名已结束】2018 Elastic & 东方航空大数据技术沙龙

Elasticsearchkennywu76 发表了文章 • 0 个评论 • 2293 次浏览 • 2018-11-14 15:21 • 来自相关话题

本次活动报名已截止,因为名额限制无法报名成功的小伙伴也不用着急,届时会议将采用zoom进行直播,在 PC、Mac、iPhone/iPad、安卓手机/平板上,点击https://www.zoomus.cn/j/1524425455 即可轻松加入观看。
本次活动报名已截止,因为名额限制无法报名成功的小伙伴也不用着急,届时会议将采用zoom进行直播,在 PC、Mac、iPhone/iPad、安卓手机/平板上,点击https://www.zoomus.cn/j/1524425455 即可轻松加入观看。

上海米哈游高薪诚聘运维开发工程师,待遇15k-30k

求职招聘davidd_yang 发表了文章 • 0 个评论 • 3657 次浏览 • 2018-11-14 14:47 • 来自相关话题

工作地点:上海
工作职责:
负责网络游戏业务的部署、发布、变更;
负责新游戏的接入、架构评估、痛点挖掘优化;
负责监控网络游戏业务的运行状况,及时处理游戏运行中出现的故障,保障网络游戏服务的正常提供;
负责与游戏运营项目组的日常沟通交流,接受并处理项目组提出的运维需求;
针对各系统编写并维护自动化运维脚本;
负责项目组相关运营支撑工具的开发(Python);
负责日常运维工作的自动化、工具化建设;
参与游戏大数据挖掘与分析;
工作要求:
本科以上学历,计算机类或相关专业;
3年以上互联网行业经验、2年以上的批量服务器维护经验;
有开发经验,掌握Python、Bash、Sed、Awk等编程语言;
有较强的抗压能力、沟通能力、推动能力和较好的服务意识;
善于团队协作、项目管理、主动思考、自我驱动强;
优先(满足之一即可):
熟悉云技术应用阿里云,腾讯云,AWS者优先;
有知名游戏维护经验者优先,有数据挖掘经验者优先;
具有开源精神,能阅读源码,有DEVOPS/大数据平台运维管理经验者优先;
熟悉ELK等实时日志处理相关工作经验优先;
熟悉Docker、K8S原理,有Docker实际应用经验者优先;
联系方式:chen.yang@mihoyo.com

某一字段含多个数值过滤查询?

ElasticsearchCoolish 回复了问题 • 2 人关注 • 2 个回复 • 3341 次浏览 • 2018-11-14 14:33 • 来自相关话题

Elastic认证考试心得

Elasticsearchkennywu76 发表了文章 • 6 个评论 • 25499 次浏览 • 2018-11-14 12:00 • 来自相关话题

2018 Elastic中国开发者大会前一天,我参加了Elastic认证工程师考试,隔天在大会的闪电演讲部分做了一个快速的分享。 昨天考试结果下来了,比较遗憾,没能通过。 不过这次参考心得颇多,值得专门写一篇文总结一下,帮助准备考认证的同学少走一点弯路。

考试内容

官方有一个考试要求达到的目标提纲[Objectives](https://training.elastic.co/ex ... ctives), 其中涵盖的知识点还是比较广的,建议每个点都要根据文档操作演练一下。 我考前几天大致扫了一下提纲,感觉基本上都熟悉,没有仔细一一演练。 到了考试的时候,才发现有几个知识点只是浮于表面的了解,细节并不熟悉,临时去读文档时间又不够。

考试环境

用自己的电脑,登陆到考试网站,有一个远程桌面连接到考试虚拟机。虚拟机上原装了5个ES集群,结点数量各异。 桌面提供有一个浏览器,可以访问kibana和官方文档站点,还有一个终端,可以ssh到集群各个结点。 考试所有操作基本都是在kibana的sense和这个终端里完成, 期间只允许访问官方文档,不允许通过Google查找解决方案。 我们是现场考试,人工监考。 常规的考试是通过摄像头远程监考的,并且需要安装一个插件,检查后台进程。 按照规定,自己的机器只能开浏览器,不允许开evernotes等其他辅助工具。
远程桌面的速度不是很快,在浏览器里翻看文档会感觉有些卡顿,所以要求对文档非常熟悉,一查即准,否则来回翻页都会消耗不少时间。最好用鼠标,翻页会容易得多,我没带鼠标,用MAC的触摸板翻页,非常痛苦。 另外用Mac的同学,要适应一下拷贝粘贴快捷键,考试机器拷贝粘贴用的是ctrl-c / ctrl-v ,用惯了Mac的快捷键会有些不适应。

考试时长

3个小时,期间可以上厕所,但是建议考前少喝水,上好厕所,时间宝贵。

考题形式

12道考题全部是上机题,每道题描述一个场景,要求解决问题或者达到某个目标。 每道题都会涉及到考试提纲里2-3个知识点,所以对各个知识点细节的了解非常重要, 只要一个知识点理解的模糊,就容易卡住。 做题顺序可以自己控制,最好先把自己熟悉,马上能搞定的先做了,耗时超过10分钟还没把握的,先放一放最后再做把。这12道题我只完成了其中的9个,有3个在现场卡了比较长时间,因为时间不够放弃, 接下来的部分会做更细节的分析。



亲历考题类型总结

  1. 给一个状态是red的集群,要求不损失数据的前提下,让集群变green。
    该题我遇到3个要解决的问题:
    • 有一个结点挂了,找到挂掉的结点,ssh上去,手动起来;
    • 此时集群变成yellow,还是有shard不能分配,检查发现有一个索引的routings设置里,routing ->include里rack1写成了rakc1,故意写错的,修正好即可
    • 集群依然还有shard是unassinged状态,继续检查发现有一个索引的routings里,include的rack数量不够,导致有些 replica分配不了。 更新一下routing,让他include更多的rack就解决了。集群状态变green。

      此题考查的知识点包括,如何查看集群状态,如果查看结点列表,如何使用allocation explain api, 如何通过索引的allocation routing控制shard的分布。因为平常工作中解决集群问题比较多,所以此题完成比较轻松。


  2. 有一个文档,内容类似dog & cat, 要求索引这条文档,并且使用match_phrase query,查询dog & cat或者dog and cat都能match。

    此题我现场没搞出来,当时第一反应是标准tokenizer已经将&剥离掉了,那么只要用stop words filter将and剥离掉,不就可以了吗? 结果配置后,发现match不上。 仔细一想,match_phase需要匹配位置的,&是tokenize阶段剥离的, and是token filter阶段剥离的,这样位置就不对了。 用analyzer api分析一下,位置的确不对。然后想到应该用synonym token filter来处理,结果配置还是一直有问题。 这时候耗时已经太多,直接放弃了。回来后又演练了一下这道题,才发现用synonym token filter是没问题的,但是tokenizer应该改成whitespace,否则&被剥离了。 总结起来还是平常这块用得少,不熟练,所以考试的时候时间一紧,脑子没转过来。

  3. 有index_a包含一些文档, 要求创建索引index_b,通过reindex api将index_a的文档索引到index_b。 要求增加一个整形字段,value是index_a的field_x的字符长度; 再增加一个数组类型的字段,value是field_y的词集合。(field_y是空格分割的一组词,比方"foo bar",索引到index_b后,要求变成["foo", "bar"]

    此题没什么技巧,就是考察reindex api的使用+ painless script。 但是我平常不怎么用painless,虽然原理上知道需要对一个字段求size,一个需要做split,但具体的语法不熟悉,也是来不及翻看文档,直接放弃。


  4. 按照要求创建一个index template,并且通过bulk api索引一些文档,达到自动创建索引的效果。 创建的索引的settings和mappings应该符合要求。

    此题比较简单,熟悉index template语法,常用的settings, mappings设置就OK了。


  5. 按要求写一个查询, 其中一个条件是某个关键词必须包含在4个字段中至少2个。

    此题也没什么技巧,考查bool query和minimum_should_match,熟悉就能写出来


  6. 按照要求写一个search template

    熟悉search template的mustache模版语言即可轻松写出,但是很遗憾,平常没用过search template,虽然知道个大概,但是当时写的时候,不知道哪里语法有问题,PUT template总是不成功。猜想可能是哪个位置的字符没有转译产生非法json字符,或者哪一层嵌套有问题。 总之就是调试不成功,又浪费了很多时间。


  7. 多层嵌套聚合,其中还包括bucket过滤

    没技巧,熟悉聚合,聚合嵌套,buckets过滤即可。


  8. 给定一个json文档,要求创建一个索引,定义一个nested field,将json文档索引成嵌套类型,同时完成指定的嵌套查询和排序。

    比较简单,熟悉nested type和nested query即可完成。


  9. 给定两个集群,都包含有某个索引。 要求配置cross cluster search,能够从其中一个集群执行跨集群搜索,写出搜索的url和query body。

    中间设置了一个陷阱,有一个集群有结点挂掉了,不能访问。 所以先要解决结点挂掉的问题,然后在要执行查询的集群配置cross cluster。 确认链接没问题以后,写出查询即可。

  10. 有一个3结点集群,还有一个kibana。 es集群没有安装x-pack,但是安装包已经放在了机器上,kibana有安装x-pack,并且启用了security,所以此时还连接不到集群。 要求给3个结点配置security,给内置的几个用户分别设定指定的密码。 之后添加指定的新用户,指定的role,并给用户赋予role a, role b。

    此题熟悉x-pack security即可。 先分别ssh到3个结点,安装x-pack后启动结点。 等结点链接成功以后,用初始化内置用户密码的脚本,按要求分别设置密码。 之后就可以用elastic这个内置的管理员账号登陆kibana了。 然后通过kibana的用户和角色管理界面,分别添加对应的用户和角色。


    还有2题是什么不太记得了,应该都是要求根据要求创建索引,reindex数据,然后执行某种类型的查询,或者聚合,比较简单吧。

    总结下来,本次考试就是考察的知识点比较多,虽然只有12道考题,但是每道考题都是对多个知识点的综合考察,对ES的理解只停留在理论上是不够的,要求比较强的实际动手能力。 能考过的同学,一定是有过比较丰富的实际操作经验,该认证的含金量我感觉还是非常非常的高!

社区日报 第448期 (2018-11-14)

社区日报千夜 发表了文章 • 0 个评论 • 1065 次浏览 • 2018-11-14 11:39 • 来自相关话题

1. 有赞搜索系统的搭建和演进
http://t.cn/EAd7TEb
2. 搜索引擎从0到1
http://t.cn/EAVZqan
3. CentOS7 上搭建多节点 Elasticsearch集群
http://t.cn/EAdzxTP
 
编辑:江水
归档:https://elasticsearch.cn/article/6132
订阅:https://tinyletter.com/elastic-daily

如何提高查询命中率的问题

Elasticsearchrochy 回复了问题 • 4 人关注 • 1 个回复 • 3864 次浏览 • 2018-11-14 10:58 • 来自相关话题

logstash到es好像数据延迟

Elasticsearchxiaoke 回复了问题 • 3 人关注 • 2 个回复 • 4639 次浏览 • 2018-11-14 10:28 • 来自相关话题

es6.x数据保存异常

Elasticsearchchenhongjie 回复了问题 • 2 人关注 • 1 个回复 • 2409 次浏览 • 2018-11-14 09:38 • 来自相关话题

elastic6.4 , 和springboot整合的时候

Elasticsearchchenhongjie 回复了问题 • 3 人关注 • 1 个回复 • 2536 次浏览 • 2018-11-14 09:35 • 来自相关话题