使用 nohup 或 disown 如果你要让某个进程运行在后台。

社区日报 第1186期 (2021-01-31)

社区日报至尊宝 发表了文章 • 0 个评论 • 1273 次浏览 • 2021-02-01 14:11 • 来自相关话题

1.搜索引擎比较– Elasticsearch,Solr还是Vespa? 
https://www.meetup.com/Haystac ... 20872 
2.(自备梯子)用于presto的高性能Elasticsearch连接器。 
https://blog.bigdataboutique.c ... uvf0w 
3.构建SaaS的首选堆栈。 
https://www.simplecto.com/dock ... 2021/

编辑:至尊宝
归档:https://ela.st/cn-daily-all 
订阅:https://ela.st/cn-daily-sub 
沙龙:https://ela.st/cn-meetup

histogram桶数量累加和cardinality统计的值不一致(cardinality的原因,和bucket_selector没关系,感谢guoyanbiao520)

Elasticsearchguoyanbiao520 回复了问题 • 1 人关注 • 1 个回复 • 2963 次浏览 • 2021-02-01 10:02 • 来自相关话题

社区日报 第1185期 (2021-01-30)

社区日报bsll 发表了文章 • 1 个评论 • 1333 次浏览 • 2021-01-30 19:47 • 来自相关话题

1.通过配置自定义分析器扩展asciifolding分析器范围

[https://stackoverflow.com/ques ... earch](https://stackoverflow.com/ques ... search)

2.字段折叠用法示例

[https://blog.csdn.net/ctwy2913 ... 59215](https://blog.csdn.net/ctwy2913 ... 759215)

3.es7.11如何提升date-histogram的聚合速度

[https://www.elastic.co/cn/blog ... -7-11](https://www.elastic.co/cn/blog ... h-7-11)


社区日报 第1184期 (2021-01-29)

社区日报laoyang360 发表了文章 • 0 个评论 • 1408 次浏览 • 2021-01-29 21:51 • 来自相关话题

1、Ansible自动化部署 Elastic Stack 
https://elasticstack.blog.csdn ... 67307
 
 2、踩坑日志之elasticSearch
 https://mp.weixin.qq.com/s/9TTGQRTFSLJo9-APnNh-SQ
 
 3、Elasticsearch中的相似度评分介绍
 https://cloud.tencent.com/developer/news/762466
 
编辑:铭毅天下
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup

Elasticsearch:EQL 入门 - 使用 EQL 检测威胁

Elasticsearchliuxg 发表了文章 • 0 个评论 • 2798 次浏览 • 2021-01-29 16:40 • 来自相关话题

EQL 的全名是 Event Query Language (EQL)。事件查询语言(EQL)是一种用于基于事件的时间序列数据(例如日志,指标和跟踪)的查询语言。EQL 在 Elastic Security 中被广泛使用。 
 
详细阅读,请参阅 https://elasticstack.blog.csdn ... 89999
EQL 的全名是 Event Query Language (EQL)。事件查询语言(EQL)是一种用于基于事件的时间序列数据(例如日志,指标和跟踪)的查询语言。EQL 在 Elastic Security 中被广泛使用。 
 
详细阅读,请参阅 https://elasticstack.blog.csdn ... 89999

如何做到批量查询效率大化

ElasticsearchFFFrp 回复了问题 • 4 人关注 • 3 个回复 • 1782 次浏览 • 2021-02-01 09:21 • 来自相关话题

filebeat7.10 收集docker容器时如何排除一些docker容器日志

Beatsstruy 回复了问题 • 2 人关注 • 1 个回复 • 2383 次浏览 • 2021-02-05 11:48 • 来自相关话题

Request Entity Too Large

回复

ElasticsearchAnswerI 发起了问题 • 1 人关注 • 0 个回复 • 3327 次浏览 • 2021-01-29 11:37 • 来自相关话题

社区日报 第1183期 (2021-01-28)

社区日报白衬衣 发表了文章 • 0 个评论 • 1264 次浏览 • 2021-01-28 22:03 • 来自相关话题

1.如何摄入 Websocket 数据到 Elasticsearch
https://elasticstack.blog.csdn ... 07195
2.提升四倍索引速度的办法
https://elasticsearch.cn/article/14228
3.滴滴Logi日志服务套件
https://blog.csdn.net/changxia ... 26532

编辑:金桥
归档:https://ela.st/cn-daily-all
订阅:https://ela.st/cn-daily-sub
沙龙:https://ela.st/cn-meetup

Elasticsearch生态&技术峰会

活动ouyangchucai 发表了文章 • 1 个评论 • 2535 次浏览 • 2021-01-28 17:29 • 来自相关话题


    开源最大的特征就是开放性,云生态则让开源技术更具开放性与创造性,Elastic 与阿里云的合作正是开源与云生态共生共荣的典范。值此合作三周年之际,我们邀请业界资深人士相聚云端,共话云上Elasticsearch生态与技术的未来。
 
    本次峰会邀请了阿里巴巴副总裁/阿里云智能高级研究员贾扬清、Elastic创始人&CEO Shay Banon共话开源与云生态未来发展之路,也汇聚了13位Elasticsearch技术领域资深的专家带来最前沿的技术分享。
 
    活动时间:2021年2月2日
    直播地址:https://developer.aliyun.com/t ... c9fkf 
 

es20210202.png

 
 

es_dingdinggroup.png

 

如何使用 Ansible自动化部署 Elastic Stack

Elasticsearchliuxg 发表了文章 • 0 个评论 • 1310 次浏览 • 2021-01-28 16:57 • 来自相关话题

Ansible 是新出现的自动化运维工具,基于Python开发,集合了众多运维工具(puppet、chef、func、fabric)的优点,实现了批量系统配置、批量程序部署、批量运行命令等功能。Ansible 是基于 paramiko 开发的,并且基于模块化工作,本身没有批量部署的能力。真正具有批量部署的是 ansible 所运行的模块,ansible 只是提供一种框架。ansible 不需要在远程主机上安装 client/agents,因为它们是基于 ssh 来和远程主机通讯的。ansible 目前已经已经被红帽官方收购,是自动化运维工具中大家认可度最高的,并且上手容易,学习简单。是每位运维工程师必须掌握的技能之一。
 
如果你想了解 ansible 是如何部署 Elastic Stack 的,请阅读系列文章:
 
如何使用 Ansible自动化部署 Elastic Stack - Overview(一)

如何使用 Ansible自动化部署 Elastic Stack - Elasticsearch (二)

如何使用 Ansible自动化部署 Elastic Stack - Kibana(三)

Elastic:如何使用 Ansible自动化部署 Elastic Stack -Security(四)

如何使用 Ansible自动化部署 Elastic Stack -Metricbeat(五)

logstash如何获取本机IP

回复

LogstashyourBigFather 发起了问题 • 1 人关注 • 0 个回复 • 3092 次浏览 • 2021-01-28 15:28 • 来自相关话题

四倍索引速度提升, 有点东西

Elasticsearchliugq 发表了文章 • 14 个评论 • 5008 次浏览 • 2021-01-27 23:43 • 来自相关话题

最近看到 INFINI Gateway 新增了一个 bulk_reshuffle filter, 于是便简单地测试一下这个功能。(Gateway [下载地址](http://release.elasticsearch.cn/) 以及 [参考文档](https://gateway.infini.sh/))

测试机器配置

系统|处理器|内存
----|------|---
Macos| 2 GHz 四核Intel Core i5 |16 GB

测试所需软件及版本

  1. Elasticsearch 7.10
  2. Kibana 7.10
  3. INFINI Gateway 最新版本
  4. Logstash 7.10
  5. Metricbeat 7.10

    本文就省略以上软件的下载和安装步骤了。 另外本文中测试 Elasticsearch 集群含两个节点,每个节点配置内存都为 1GB ,其他参数均为默认。

    测试步骤


    准备测试数据文件

    本文测试数据文件 nginx_mock_log ,文件中每行结构如下:

    {"timestamp":1611540661651,"method":"POST","msg":"mock log"}

    大概一千多万条

    Logstatsh 使用 Input file 模式直接输出数据到 Elasticsearch


    编辑 Logstash 配置 test.conf 如下:

    <br /> input{<br /> file {<br /> path => ["/test/nginx_mock_log"]<br /> type => "file_monitor"<br /> start_position => "beginning"<br /> }<br /> }<br /> <br /> output{<br /> elasticsearch {<br /> hosts => ["localhost:9200"]<br /> index => "nginx_mock_log"<br /> http_compression => false<br /> }<br /> }<br />

    在 kibana 中创建索引 nginx_mock_log ,将主分片设置为2(为了体现出 Gateway的性能优势, 主分片数应设置大于1), 配置如下:
    <br /> <br /> PUT nginx_mock_log<br /> {<br /> "mappings" : {<br /> "properties" : {<br /> "@timestamp" : {<br /> "type" : "date"<br /> },<br /> "@version" : {<br /> "type" : "text",<br /> "fields" : {<br /> "keyword" : {<br /> "type" : "keyword",<br /> "ignore_above" : 256<br /> }<br /> }<br /> },<br /> "host" : {<br /> "type" : "text",<br /> "fields" : {<br /> "keyword" : {<br /> "type" : "keyword",<br /> "ignore_above" : 256<br /> }<br /> }<br /> },<br /> "message" : {<br /> "type" : "text",<br /> "fields" : {<br /> "keyword" : {<br /> "type" : "keyword",<br /> "ignore_above" : 256<br /> }<br /> }<br /> },<br /> "path" : {<br /> "type" : "text",<br /> "fields" : {<br /> "keyword" : {<br /> "type" : "keyword",<br /> "ignore_above" : 256<br /> }<br /> }<br /> },<br /> "type" : {<br /> "type" : "text",<br /> "fields" : {<br /> "keyword" : {<br /> "type" : "keyword",<br /> "ignore_above" : 256<br /> }<br /> }<br /> }<br /> }<br /> },<br /> "settings" : {<br /> "number_of_shards" : "2"<br /> }<br /> }<br />
    运行 Logstash

    /usr/local/logstash/bin/logstash -f test.conf

    打开 Kibana Stack Monitorning 查看 Indexing Rate 监控指标如下图:

    1.png




    从图中可以看到索引速率基本保持在4300/s 上下

    Logstatsh 使用 Input file 模式输出数据到 Gateway


    进入 Kibana 删除索引 nginx_mock_log 并重建
    <br /> DELETE nginx_mock_log<br /> <br /> PUT nginx_mock_log<br /> {<br /> "mappings" : {<br /> "properties" : {<br /> "@timestamp" : {<br /> "type" : "date"<br /> },<br /> "@version" : {<br /> "type" : "text",<br /> "fields" : {<br /> "keyword" : {<br /> "type" : "keyword",<br /> "ignore_above" : 256<br /> }<br /> }<br /> },<br /> "host" : {<br /> "type" : "text",<br /> "fields" : {<br /> "keyword" : {<br /> "type" : "keyword",<br /> "ignore_above" : 256<br /> }<br /> }<br /> },<br /> "message" : {<br /> "type" : "text",<br /> "fields" : {<br /> "keyword" : {<br /> "type" : "keyword",<br /> "ignore_above" : 256<br /> }<br /> }<br /> },<br /> "path" : {<br /> "type" : "text",<br /> "fields" : {<br /> "keyword" : {<br /> "type" : "keyword",<br /> "ignore_above" : 256<br /> }<br /> }<br /> },<br /> "type" : {<br /> "type" : "text",<br /> "fields" : {<br /> "keyword" : {<br /> "type" : "keyword",<br /> "ignore_above" : 256<br /> }<br /> }<br /> }<br /> }<br /> },<br /> "settings" : {<br /> "number_of_shards" : "2"<br /> }<br /> }<br />

    修改 Logstash 配置 test.conf 如下:
    <br /> input{<br /> file {<br /> path => ["/test/nginx_mock_log"]<br /> type => "file_monitor"<br /> start_position => "beginning"<br /> }<br /> }<br /> <br /> output{<br /> elasticsearch {<br /> hosts => ["localhost:8000"]<br /> index => "nginx_mock_log"<br /> http_compression => false<br /> }<br /> }<br />


    修改 Gateway 配置文件 gateway.yaml 如下:
    ```
    path.data: data
    path.logs: log

    entry:

    • name: es_gateway #your gateway endpoint
      enabled: true
      router: default
      network:
      binding: localhost:8000
      reuse_port: true #you can start multi gateway instance, they share same port, to full utilize system's resources

      flow:
    • name: bulk_es_test
      filter: #comment out any filter sections, like you don't need cache or rate-limiter
      • name: bulk_reshuffle
        parameters:
        elasticsearch: dev
        level: node
        mode: async
      • name: elasticsearch
        parameters:
        elasticsearch: dev
        refresh:
        enabled: true
        interval: 30s
    • name: request_logging
      filter:
      • name: request_logging
        parameters:
        queue_name: request_logging
        router:
    • name: default
      default_flow: bulk_es_test
      tracing_flow: request_logging

      elasticsearch:
    • name: dev
      enabled: true
      endpoint: http://localhost:9200 # if your elasticsearch is using https, your gateway should be listen on as https as well
      basic_auth: #used to discovery full cluster nodes, or check elasticsearch's health and versions
      username: elastic
      password: yV6syH3KLt4DxqMlCyag
      discovery: # auto discovery elasticsearch cluster nodes
      enabled: true
      refresh:
      enabled: true

      modules:
    • name: elastic
      enabled: true
      elasticsearch: dev
      store:
      enabled: true
      orm:
      enabled: true
      init_template: true
      template_name: ".infini-default1"
      indexprefix: "gateway"

    • name: pipeline
      enabled: true
      runners:
    • name: nodes_index
      enabled: true
      max_go_routine: 2
      threshold_in_ms: 0
      timeout_in_ms: 5000
      pipeline_id: bulk_request_ingest
    • name: request_logging_test_name
      enabled: true
      max_go_routine: 2
      threshold_in_ms: 0
      timeout_in_ms: 5000
      pipeline_id: request_logging_index


      pipelines:
    • name: bulk_request_ingest
      start:
      joint: bulk_indexing
      enabled: true
      parameters:
      elasticsearch: "dev"
      timeout: "5s"
      worker_size: 10
      bulk_size_in_mb: 1 #in MB
    • name: request_logging_index
      start:
      joint: json_indexing
      enabled: true
      parameters:
      index_name: "gateway_requests"
      elasticsearch: "dev"
      input_queue: "request_logging"
      timeout: "5s"
      worker_size: 10
      bulk_size_in_mb: 1 #in MB

      queue:
      min_msg_size: 1
      max_msg_size: 5000000000
      max_bytes_per_file: 53687091200
      sync_every_records: 100000 # sync by records count
      sync_timeout_in_ms: 10000 # sync by time in million seconds
      write_chan_buffer: 1000
      read_chan_buffer: 1000
      ``<br /> 以上各配置节点含义,请参考 [Gateway 文档](<a href="https://gateway.infini.sh" rel="nofollow" target="_blank">https://gateway.infini.sh</a>/)<br /> <br /> 启动 Gateway <br /> ./gateway <br /> <br /> 删除 Logstash data 目录<br /> <br /> rm -rf /usr/local/logstash/data<br /> <br /> 启动 Logstash<br /> <br /> /usr/local/logstash/bin/logstash -f test.conf`

      打开 Kibana Stack Monitorning 查看 Indexing Rate 监控指标如下图:


      2.png



      从上图后半部分可以看到索引速率可以保持在 25000/s 上下(一会儿的功夫,一千多万条数据导入ES完事了)

      前面看到 Gateway 配置开启了 request_logging,因此可以在 Kibana Dashboard 里面的
      INFINI Gateway Dashboard 查看请求信息,如下图:

      3.png



      4.png




      注意,上面图中的请求速率是 _bulk 请求的速率,不是索引速率



      总结

      从测试结果来看,相同环境下,用 Logstash elasticsearch output 输出数据到 Gateway 的方式比
      Logstash elasticsearch output 直接到 ES 的方式速率快了4倍,不得不说这速率是真的杠杠的。至于能不能通过参数调优再提升速率呢?大家有兴趣的自己下载测试吧!最后感谢 medcl 大神出品。

使用jest client 6.3.1的异步方法executeAsync写ES,主线程不会结束

回复

Elasticsearchxulunfan1994 发起了问题 • 1 人关注 • 0 个回复 • 2229 次浏览 • 2021-01-27 13:14 • 来自相关话题

elastic 代码调用自定义插件

回复

Elasticsearchcainiaoe 回复了问题 • 3 人关注 • 1 个回复 • 1400 次浏览 • 2021-01-28 09:17 • 来自相关话题