类比mysql查询,适合新手学习Elasticsearch的DSL查询语句

Mysql查询与Elasticsearch的DSL查询语句对照

作者：

小森同学，互联网公司搜索开发工程师。

前言

作为新入门的后端开发人员，一般对Mysql，SqlServer这类的关系型数据库或多或少都有了解。当入门Elasticsearch时，发现其DSL语句与关系型数据库的查询完全不一样，不再是那熟悉的语法，顿感门槛有点高。为了方便熟悉关系型数据库查询的同学，更加容易，快捷的理解并掌握DSL基础语法，本文将进行Mysql与DSL语句进行类比。

一、Mysql数据库与Elasticsearch的类比

关系型数据库（比如Mysql）	非关系型数据库（Elasticsearch）
数据库 Database	索引 Index
表 Table	类型 Type
数据行 Row	文档 Document
数据列 Column	字段 Field
约束 Schema	映射 Mapping

二、Mysql查询语句与DSL查询类比

Mysql查询语句与Elasticsearch的DSL查询类比，主要通过mysql库中的search_lexicon表和es中的search_lexicon_v1索引进行比较。

2.1 search_lexicon 表结构

CREATE TABLE `search_lexicon` (
  `id` int(10) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增id',
  `keyword` varchar(50) NOT NULL DEFAULT '' COMMENT '关键词',
  `keyword_crc32` int(10) unsigned NOT NULL DEFAULT '0' COMMENT '关键词校验',
  `search_type` tinyint(1) NOT NULL DEFAULT '0' COMMENT '类型',
  `consumer_id` varchar(50) NOT NULL DEFAULT '' COMMENT '消费者ID',
  `num` int(10) unsigned NOT NULL DEFAULT '0' COMMENT '文档数',
  `views` int(10) unsigned NOT NULL DEFAULT '0' COMMENT '搜索次数',
  `state` tinyint(1) unsigned NOT NULL DEFAULT '1' COMMENT '状态 0 关闭 1 开启',
  `is_del` tinyint(1) unsigned NOT NULL DEFAULT '0' COMMENT '是否删除 0 正常 1 删除',
  `createtime` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '数据创建时间',
  `updatetime` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '数据最后更新时间',
  PRIMARY KEY (`id`),
  KEY `idx_search_lexicon_views` (`views`),
  KEY `idx_search_lexicon_updatetime` (`updatetime`) USING BTREE,
  KEY `idx_search_lexicon_keyword_type` (`keyword_crc32`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='搜索词库';

2.2 search_lexicon_v1 索引结构

{
  "search_lexicon_v1" : {
    "mappings" : {
      "_doc" : {
        "properties" : {
          "@timestamp" : {
            "type" : "date"
          },
          "@version" : {
            "type" : "long"
          },
          "consumer_id" : {
            "type" : "keyword"
          },
          "createtime" : {
            "type" : "date",
            "format" : "yyyy-MM-dd HH:mm:ss||strict_date_optional_time||epoch_millis"
          },
          "id" : {
            "type" : "integer"
          },
          "is_del" : {
            "type" : "integer"
          },
          "keyword" : {
            "type" : "text",
            "fields" : {
              "standard" : {
                "type" : "text",
                "analyzer" : "by_standard_no_synonym"
              }
            },
            "analyzer" : "by_max_word_pinyin_no_synonym"
          },
          "num" : {
            "type" : "long"
          },
          "search_type" : {
            "type" : "integer"
          },
          "state" : {
            "type" : "integer"
          },
          "updatetime" : {
            "type" : "date",
            "format" : "yyyy-MM-dd HH:mm:ss||strict_date_optional_time||epoch_millis"
          },
          "views" : {
            "type" : "long"
          }
        }
      }
    }
  }
}

2.3 查询语句对照

注意：dsl查询，每次默认展示10（size默认为10）条

以下的查询条件，是为了写查询而构造的，无任何实质性的意义，仅供mysql查询与dsl查询对比用

布尔查询支持的子查询类型共有四种，分别是：must，should，must_not和filter：

查询字句	说明	类型
must	文档必须符合must中所有的条件，会影响相关性得分	数组
should	文档应该匹配should子句查询的一个或多个	数组
must_not	文档必须不符合must_not 中的所有条件	数组
filter	过滤器，文档必须匹配该过滤条件，跟must子句的唯一区别是，filter不影响查询的score ,会缓存	字典

A、查询所有数据

mysql

SELECT * FROM search_lexicon

dsl

GET search_lexicon/_search
{

}
或
GET search_lexicon/_search
{
  "query": {
    "match_all": {}
  }
}

B、查询一个条件且条件只有一个值（consumer_id=demo）的数据

mysql

SELECT * FROM search_lexicon WHERE consumer_id='demo'

dsl

GET search_lexicon/_search
{
  "query": {
    "bool": {
      "filter": {
        "term": {
          "consumer_id": "demo"
        }
      }
    }
  }
}
或
GET search_lexicon/_search
{
  "query": {
    "bool": {
      "filter": [
        {
          "term": {
            "consumer_id": "demo"
          }
        }
      ]
    }
  }
}

两者的区别在于前一个filter是一个对象，filter中只能放一个条件，后者filter是一个数组，里面可以放多个对象（多个查询条件）,后续都将按照第二种方式查询

C、查询一个条件且条件有多个值（consumer_id的值为demo，demo2）的数据

mysql

SELECT * FROM search_lexicon WHERE consumer_id in('demo','demo2')

dsl

GET search_lexicon/_search
{
  "query": {
    "bool": {
      "filter": [
        {
          "terms": {
            "consumer_id": [
              "demo",
              "demo2"
            ]
          }
        }
      ]
    }
  }
}

D、查询consumer_id=demo 且 state=1的数据

mysql

SELECT * FROM search_lexicon WHERE consumer_id ='demo' and state=1

dsl

GET search_lexicon/_search
{
  "query": {
    "bool": {
      "filter": [
        {
          "term": {
            "consumer_id": "demo"
          }
        },
         {
          "term": {
            "state": 1
          }
        }
      ]
    }
  }
}

E、查询consumer_id=demo , state=1 且 is_del<>1的数据

mysql

SELECT * FROM search_lexicon WHERE consumer_id ='demo' and state=1 and is_del <>1

dsl

GET search_lexicon/_search
{
  "query": {
    "bool": {
      "filter": [
        {
          "term": {
            "consumer_id": "demo"
          }
        },
         {
          "term": {
            "state": 1
          }
        }
      ],
      "must_not": [
        {
          "term": {
            "is_del": {
              "value": 1
            }
          }
        }
      ]
    }
  }
}

F、查询Sconsumer_id ='demo' or (state=1 and is_del =0)的数据

mysql

SELECT * FROM search_lexicon WHERE consumer_id ='demo' or (state=1 and is_del =0)

dsl

GET search_lexicon/_search
{
  "query": {
    "bool": {
      "should": [
        {
          "term": {
            "consumer_id": {
              "value": "demo"
            }
          }
        },
        {
          "bool": {
            "filter": [
              {
                "term": {
                  "state": 1
                }
              },
              {
                "term": {
                  "is_del": 0
                }
              }
            ]
          }
        }
      ]
    }
  }
}

G、在F的基础上，查询指定字段

mysql

SELECT id,keyword,consumer_id,num,views,state,is_del FROM search_lexicon WHERE consumer_id ='demo' or (state=1 and is_del =0)

dsl

GET search_lexicon/_search
{
  "query": {
    "bool": {
      "should": [
        {
          "term": {
            "consumer_id": {
              "value": "demo"
            }
          }
        },
        {
          "bool": {
            "filter": [
              {
                "term": {
                  "state": 1
                }
              },
              {
                "term": {
                  "is_del": 0
                }
              }
            ]
          }
        }
      ]
    }
  },
  "_source": {
    "includes": [
      "id",
      "keyword",
      "num",
      "is_del",
      "state",
      "consumer_id",
      "views"
    ]
  }
}

H、在G的基础上，增加排序

mysql

SELECT id,keyword,consumer_id,num,views,state,is_del FROM search_lexicon WHERE consumer_id ='demo' or (state=1 and is_del =0) ORDER BY state DESC,id DESC

dsl

GET search_lexicon/_search
{
  "query": {
    "bool": {
      "should": [
        {
          "term": {
            "consumer_id": {
              "value": "demo"
            }
          }
        },
        {
          "bool": {
            "filter": [
              {
                "term": {
                  "state": 1
                }
              },
              {
                "term": {
                  "is_del": 0
                }
              }
            ]
          }
        }
      ]
    }
  },
  "_source": {
    "includes": [
      "id",
      "keyword",
      "num",
      "is_del",
      "state",
      "consumer_id",
      "views"
    ]
  },
  "sort": [
    {
      "state": {
        "order": "desc"
      }
    },
    {
      "id": {
        "order": "desc"
      }
    }
  ]
}

I、在H的基础上，添加分页

mysql

SELECT id,keyword,consumer_id,num,views,state,is_del FROM search_lexicon WHERE consumer_id ='demo' or (state=1 and is_del =0) ORDER BY state DESC,id DESC LIMIT 0,20

dsl

GET search_lexicon/_search
{
  "query": {
    "bool": {
      "should": [
        {
          "term": {
            "consumer_id": {
              "value": "demo"
            }
          }
        },
        {
          "bool": {
            "filter": [
              {
                "term": {
                  "state": 1
                }
              },
              {
                "term": {
                  "is_del": 0
                }
              }
            ]
          }
        }
      ]
    }
  },
  "_source": {
    "includes": [
      "id",
      "keyword",
      "num",
      "is_del",
      "state",
      "consumer_id",
      "views"
    ]
  },
  "sort": [
    {
      "state": {
        "order": "desc"
      }
    },
    {
      "id": {
        "order": "desc"
      }
    }
  ],
  "from": 0,
  "size": 20
}

# from 是一个偏移量，size为每页显示条数

J、去重查询

mysql

SELECT DISTINCT state FROM search_lexicon WHERE consumer_id = 'demo'

dsl

# 通过折叠去重查询
GET search_lexicon/_search
{
  "query": {
    "bool": {
      "filter": [
        {
          "term": {
            "consumer_id": {
              "value": "demo"
            }
          }
        }
      ]
    }
  },
  "collapse": {
    "field": "state"
  }
}

K、分组查询

mysql

SELECT  * FROM search_lexicon WHERE consumer_id = 'demo' GROUP BY state

dsl

GET search_lexicon/_search
{
  "query": {
    "bool": {
      "filter": [
        {
          "term": {
            "consumer_id": {
              "value": "demo"
            }
          }
        }
      ]
    }
  },
  "size": 0, 
  "aggs": {
    "aaa": {
      "terms": {
        "field": "state",
        "size": 10
      }
    }
  }
}

L、模糊匹配

mysql

SELECT * FROM search_lexicon WHERE consumer_id="demo" and keyword LIKE '%渴望%'

dsl

GET search_lexicon/_search
{
  "query": {
    "bool": {
      "filter": [
        {
          "term": {
            "consumer_id": {
              "value": "demo"
            }
          }
        }
      ],
      "must": [
        {
          "match": {
            "keyword": "渴望"
          }
        }
      ]
    }
  }
}

三、总结

Mysql查询与DSL查询对照，用心体会二者之间，上下文之间，各查询条件的差异与相似，快速掌握DSL的语法结构，You can do it!

声明：

本文版权归作者所有，未经许可不得擅自转载或引用。原文地址：https://elasticsearch.cn/article/13760

继续阅读 »

Mysql查询与Elasticsearch的DSL查询语句对照

作者：

小森同学，互联网公司搜索开发工程师。

前言

作为新入门的后端开发人员，一般对Mysql，SqlServer这类的关系型数据库或多或少都有了解。当入门Elasticsearch时，发现其DSL语句与关系型数据库的查询完全不一样，不再是那熟悉的语法，顿感门槛有点高。为了方便熟悉关系型数据库查询的同学，更加容易，快捷的理解并掌握DSL基础语法，本文将进行Mysql与DSL语句进行类比。

一、Mysql数据库与Elasticsearch的类比

关系型数据库（比如Mysql）	非关系型数据库（Elasticsearch）
数据库 Database	索引 Index
表 Table	类型 Type
数据行 Row	文档 Document
数据列 Column	字段 Field
约束 Schema	映射 Mapping

二、Mysql查询语句与DSL查询类比

Mysql查询语句与Elasticsearch的DSL查询类比，主要通过mysql库中的search_lexicon表和es中的search_lexicon_v1索引进行比较。

2.1 search_lexicon 表结构

CREATE TABLE `search_lexicon` (
  `id` int(10) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增id',
  `keyword` varchar(50) NOT NULL DEFAULT '' COMMENT '关键词',
  `keyword_crc32` int(10) unsigned NOT NULL DEFAULT '0' COMMENT '关键词校验',
  `search_type` tinyint(1) NOT NULL DEFAULT '0' COMMENT '类型',
  `consumer_id` varchar(50) NOT NULL DEFAULT '' COMMENT '消费者ID',
  `num` int(10) unsigned NOT NULL DEFAULT '0' COMMENT '文档数',
  `views` int(10) unsigned NOT NULL DEFAULT '0' COMMENT '搜索次数',
  `state` tinyint(1) unsigned NOT NULL DEFAULT '1' COMMENT '状态 0 关闭 1 开启',
  `is_del` tinyint(1) unsigned NOT NULL DEFAULT '0' COMMENT '是否删除 0 正常 1 删除',
  `createtime` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '数据创建时间',
  `updatetime` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '数据最后更新时间',
  PRIMARY KEY (`id`),
  KEY `idx_search_lexicon_views` (`views`),
  KEY `idx_search_lexicon_updatetime` (`updatetime`) USING BTREE,
  KEY `idx_search_lexicon_keyword_type` (`keyword_crc32`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='搜索词库';

2.2 search_lexicon_v1 索引结构

{
  "search_lexicon_v1" : {
    "mappings" : {
      "_doc" : {
        "properties" : {
          "@timestamp" : {
            "type" : "date"
          },
          "@version" : {
            "type" : "long"
          },
          "consumer_id" : {
            "type" : "keyword"
          },
          "createtime" : {
            "type" : "date",
            "format" : "yyyy-MM-dd HH:mm:ss||strict_date_optional_time||epoch_millis"
          },
          "id" : {
            "type" : "integer"
          },
          "is_del" : {
            "type" : "integer"
          },
          "keyword" : {
            "type" : "text",
            "fields" : {
              "standard" : {
                "type" : "text",
                "analyzer" : "by_standard_no_synonym"
              }
            },
            "analyzer" : "by_max_word_pinyin_no_synonym"
          },
          "num" : {
            "type" : "long"
          },
          "search_type" : {
            "type" : "integer"
          },
          "state" : {
            "type" : "integer"
          },
          "updatetime" : {
            "type" : "date",
            "format" : "yyyy-MM-dd HH:mm:ss||strict_date_optional_time||epoch_millis"
          },
          "views" : {
            "type" : "long"
          }
        }
      }
    }
  }
}

2.3 查询语句对照

注意：dsl查询，每次默认展示10（size默认为10）条

以下的查询条件，是为了写查询而构造的，无任何实质性的意义，仅供mysql查询与dsl查询对比用

布尔查询支持的子查询类型共有四种，分别是：must，should，must_not和filter：

查询字句	说明	类型
must	文档必须符合must中所有的条件，会影响相关性得分	数组
should	文档应该匹配should子句查询的一个或多个	数组
must_not	文档必须不符合must_not 中的所有条件	数组
filter	过滤器，文档必须匹配该过滤条件，跟must子句的唯一区别是，filter不影响查询的score ,会缓存	字典

A、查询所有数据

mysql

SELECT * FROM search_lexicon

dsl

GET search_lexicon/_search
{

}
或
GET search_lexicon/_search
{
  "query": {
    "match_all": {}
  }
}

B、查询一个条件且条件只有一个值（consumer_id=demo）的数据

mysql

SELECT * FROM search_lexicon WHERE consumer_id='demo'

dsl

GET search_lexicon/_search
{
  "query": {
    "bool": {
      "filter": {
        "term": {
          "consumer_id": "demo"
        }
      }
    }
  }
}
或
GET search_lexicon/_search
{
  "query": {
    "bool": {
      "filter": [
        {
          "term": {
            "consumer_id": "demo"
          }
        }
      ]
    }
  }
}

两者的区别在于前一个filter是一个对象，filter中只能放一个条件，后者filter是一个数组，里面可以放多个对象（多个查询条件）,后续都将按照第二种方式查询

C、查询一个条件且条件有多个值（consumer_id的值为demo，demo2）的数据

mysql

SELECT * FROM search_lexicon WHERE consumer_id in('demo','demo2')

dsl

GET search_lexicon/_search
{
  "query": {
    "bool": {
      "filter": [
        {
          "terms": {
            "consumer_id": [
              "demo",
              "demo2"
            ]
          }
        }
      ]
    }
  }
}

D、查询consumer_id=demo 且 state=1的数据

mysql

SELECT * FROM search_lexicon WHERE consumer_id ='demo' and state=1

dsl

GET search_lexicon/_search
{
  "query": {
    "bool": {
      "filter": [
        {
          "term": {
            "consumer_id": "demo"
          }
        },
         {
          "term": {
            "state": 1
          }
        }
      ]
    }
  }
}

E、查询consumer_id=demo , state=1 且 is_del<>1的数据

mysql

SELECT * FROM search_lexicon WHERE consumer_id ='demo' and state=1 and is_del <>1

dsl

GET search_lexicon/_search
{
  "query": {
    "bool": {
      "filter": [
        {
          "term": {
            "consumer_id": "demo"
          }
        },
         {
          "term": {
            "state": 1
          }
        }
      ],
      "must_not": [
        {
          "term": {
            "is_del": {
              "value": 1
            }
          }
        }
      ]
    }
  }
}

F、查询Sconsumer_id ='demo' or (state=1 and is_del =0)的数据

mysql

SELECT * FROM search_lexicon WHERE consumer_id ='demo' or (state=1 and is_del =0)

dsl

GET search_lexicon/_search
{
  "query": {
    "bool": {
      "should": [
        {
          "term": {
            "consumer_id": {
              "value": "demo"
            }
          }
        },
        {
          "bool": {
            "filter": [
              {
                "term": {
                  "state": 1
                }
              },
              {
                "term": {
                  "is_del": 0
                }
              }
            ]
          }
        }
      ]
    }
  }
}

G、在F的基础上，查询指定字段

mysql

SELECT id,keyword,consumer_id,num,views,state,is_del FROM search_lexicon WHERE consumer_id ='demo' or (state=1 and is_del =0)

dsl

GET search_lexicon/_search
{
  "query": {
    "bool": {
      "should": [
        {
          "term": {
            "consumer_id": {
              "value": "demo"
            }
          }
        },
        {
          "bool": {
            "filter": [
              {
                "term": {
                  "state": 1
                }
              },
              {
                "term": {
                  "is_del": 0
                }
              }
            ]
          }
        }
      ]
    }
  },
  "_source": {
    "includes": [
      "id",
      "keyword",
      "num",
      "is_del",
      "state",
      "consumer_id",
      "views"
    ]
  }
}

H、在G的基础上，增加排序

mysql

SELECT id,keyword,consumer_id,num,views,state,is_del FROM search_lexicon WHERE consumer_id ='demo' or (state=1 and is_del =0) ORDER BY state DESC,id DESC

dsl

GET search_lexicon/_search
{
  "query": {
    "bool": {
      "should": [
        {
          "term": {
            "consumer_id": {
              "value": "demo"
            }
          }
        },
        {
          "bool": {
            "filter": [
              {
                "term": {
                  "state": 1
                }
              },
              {
                "term": {
                  "is_del": 0
                }
              }
            ]
          }
        }
      ]
    }
  },
  "_source": {
    "includes": [
      "id",
      "keyword",
      "num",
      "is_del",
      "state",
      "consumer_id",
      "views"
    ]
  },
  "sort": [
    {
      "state": {
        "order": "desc"
      }
    },
    {
      "id": {
        "order": "desc"
      }
    }
  ]
}

I、在H的基础上，添加分页

mysql

SELECT id,keyword,consumer_id,num,views,state,is_del FROM search_lexicon WHERE consumer_id ='demo' or (state=1 and is_del =0) ORDER BY state DESC,id DESC LIMIT 0,20

dsl

GET search_lexicon/_search
{
  "query": {
    "bool": {
      "should": [
        {
          "term": {
            "consumer_id": {
              "value": "demo"
            }
          }
        },
        {
          "bool": {
            "filter": [
              {
                "term": {
                  "state": 1
                }
              },
              {
                "term": {
                  "is_del": 0
                }
              }
            ]
          }
        }
      ]
    }
  },
  "_source": {
    "includes": [
      "id",
      "keyword",
      "num",
      "is_del",
      "state",
      "consumer_id",
      "views"
    ]
  },
  "sort": [
    {
      "state": {
        "order": "desc"
      }
    },
    {
      "id": {
        "order": "desc"
      }
    }
  ],
  "from": 0,
  "size": 20
}

# from 是一个偏移量，size为每页显示条数

J、去重查询

mysql

SELECT DISTINCT state FROM search_lexicon WHERE consumer_id = 'demo'

dsl

# 通过折叠去重查询
GET search_lexicon/_search
{
  "query": {
    "bool": {
      "filter": [
        {
          "term": {
            "consumer_id": {
              "value": "demo"
            }
          }
        }
      ]
    }
  },
  "collapse": {
    "field": "state"
  }
}

K、分组查询

mysql

SELECT  * FROM search_lexicon WHERE consumer_id = 'demo' GROUP BY state

dsl

GET search_lexicon/_search
{
  "query": {
    "bool": {
      "filter": [
        {
          "term": {
            "consumer_id": {
              "value": "demo"
            }
          }
        }
      ]
    }
  },
  "size": 0, 
  "aggs": {
    "aaa": {
      "terms": {
        "field": "state",
        "size": 10
      }
    }
  }
}

L、模糊匹配

mysql

SELECT * FROM search_lexicon WHERE consumer_id="demo" and keyword LIKE '%渴望%'

dsl

GET search_lexicon/_search
{
  "query": {
    "bool": {
      "filter": [
        {
          "term": {
            "consumer_id": {
              "value": "demo"
            }
          }
        }
      ],
      "must": [
        {
          "match": {
            "keyword": "渴望"
          }
        }
      ]
    }
  }
}

三、总结

Mysql查询与DSL查询对照，用心体会二者之间，上下文之间，各查询条件的差异与相似，快速掌握DSL的语法结构，You can do it!

声明：

本文版权归作者所有，未经许可不得擅自转载或引用。原文地址：https://elasticsearch.cn/article/13760

收起阅读 »

社区日报第926期 (2020-04-28)

1、如何为Elasticsearch启动https访问。
https://t.cn/A6Aw0l6j
2、基于Kafka、 MySQL、 Elasticsearch、 Kibana并使用Flink SQL构建一个实时分析应用。
https://t.cn/A6AwHLJZ
3、一文解答为什么Keepnet要使用Elasticsearch。
https://t.cn/A6Aw0TEo

编辑：叮咚光军
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub

继续阅读 »

社区日报第925期 (2020-04-27)

1.如何做到elasticsearch每秒5千万请求;
http://t.cn/A6haJlU5
2. 纯python的mysql到ES的数据同步工具
http://t.cn/A6Az8btG
3. 同步mysql到ES到go工具
http://t.cn/RC44piW

编辑：wt
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup

继续阅读 »

社区日报第924期 (2020-04-26)

1.使用Filebeat将您的日志发送到Elasticsearch。
http://t.cn/A6Av2UuG
2.（自备梯子）通过Etherbeat将以太坊索引到Elasticsearch。
http://t.cn/A6AvwqiA
3.（自备梯子）冠状病毒危机将迫使我们重新考虑全民医疗保健。
http://t.cn/A6AvA1mq

编辑：至尊宝
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup

继续阅读 »

社区日报第923期 (2020-04-25）

1.使用es机器学习检测异常数值

http://t.cn/A6wkNosn

2.一款支持KNN近邻搜索的es插件

http://t.cn/A6wkNosu

3.从twitter api获取数据导入es，并用kibana显示的开源项目

http://t.cn/A6wkNos3

继续阅读 »

社区日报第922期 (2020-04-24)

1、1小时ElasticSearch求生指南
https://t.cn/A6wdLM5R
2、Elasticsearch 7.4 手册阅读笔记
https://t.cn/A6wdLxrv
3、grafana和kibana对比
https://t.cn/RDFwTe0

编辑：铭毅天下
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub

继续阅读 »

社区日报第921期 (2020-04-23)

1、基于 ELK 监控 amazon eks 日志和指标
http://t.cn/A6wBiUNF
2、Elastic APM 入门视频
http://t.cn/A6wBiUNe
3、基于 Elastic Go Library 封装的简化 dsl 拼装库
http://t.cn/A6h3krug

编辑：rockybean
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub

继续阅读 »

社区日报第920期 (2020-04-22)

1、Elastic 官方免费培训课程，还不赶紧学起来！
http://t.cn/A6wmvk9z
2、Elasticsearch 数据存储架构选择，是 Raid0，Raid5 还是 JBOD 呢？
http://t.cn/A6wmvk9h
3、从腾讯云到自建机房？ES集群迁移架构实战
http://t.cn/A6wmvk9A

编辑：rockybean
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub

继续阅读 »

社区日报第919期 (2020-04-21)

1、Elasticsearch Sql详解。
https://t.cn/R4G1MCi
2、Elasticsearch集群规模和容量规划的底层逻辑。
https://t.cn/A6w8HeKs
3、为什么要从MongoDB迁移到Elasticsearch。
https://t.cn/A6w8Hksf

编辑：叮咚光军
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub

继续阅读 »

社区日报第918期 (2020-04-20)

1.spring boot 整合 es 实践
http://t.cn/A6wlaPx4
2.ES在不同场景下构建数据仓库
http://t.cn/A6wjy9bu
3.基于ElasticSearch的OLAP框架思路
http://t.cn/A6wjyYJi

编辑：cyberdak
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup

继续阅读 »

社区日报第917期 (2020-04-19)

1.使用示例了解Elasticsearch集群，节点，索引和文档。
http://t.cn/A6w0OdR0
2.20种出色的ETL工具，以及对ETL说“不”的案例。
http://t.cn/A6w0YpGx
3.（自备梯子）ZOOM没有端到端加密。
http://t.cn/A6ZNdAWo

编辑：至尊宝
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup

继续阅读 »

社区日报第916期 (2020-04-18）

1.将模型作为组件，以ES为后台的问答系统

http://t.cn/A6PushY3

2.在ES中查询多个多边形中的某一位置

http://t.cn/A6w0V8j4

3.图数据库介绍

http://t.cn/A6w0V8jy

继续阅读 »

社区日报第915期 (2020-04-17)

1、elasticsearch在电商中的应用
https://t.cn/A6wKaJTM
2、elasticsearch图数据库实战场景（梯子）
https://t.cn/R9Xgj2X
3、elasticsearch复杂父子关系实战（梯子）
https://t.cn/A6wKaHqj

编辑：铭毅天下
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup

继续阅读 »

社区日报第914期 (2020-04-16)

1.从MongoDB迁移到ES后，我们减少了80%的服务器
https://t.cn/A6wah6Gj
2.仿京东淘宝搜索框实战
https://t.cn/A6wSZd7a
3.为Nodejs微服务提供APM功能
https://t.cn/A6wSZDzX

编辑：金桥
归档：https://ela.st/cn-daily-all
订阅：https://ela.st/cn-daily-sub
沙龙：https://ela.st/cn-meetup

继续阅读 »

[社招]小米数据平台开发

团队介绍
小米计算平台隶属于小米云平台事业部，负责支持小米集团各业务线计算产品的需求，愿景是提供一站式的计算平台服务。计算平台主要负责开发、改进和推广全公司的大数据分析处理基础架构，包括分布式搜索引擎ElasticSearch、消息中间件（Talos/EMQ/Kafka）和数据集成服务、离线资源调度（Yarn/Azkaban）、计算引擎服务（Flink/Spark）和作业管理平台、OLAP服务（Hive/Kylin/Doris/Druid）等服务。团队具有清晰的使命、优秀的成员、良好的学习氛围。期待对大数据基础架构感兴趣的新伙伴加入，共同成长。
OLAP平台开发工程师
职位描述
1.负责小米云平台 Hive/ElasticSearch 相关系统的研发和运维工作；
2.保障线上服务的高可用，并为此进行服务架构、部署架构、容灾预案等方面的优化；
3. 参与开源，提高小米在开源社区的影响力。
任职要求
1.扎实的计算机专业基础，熟悉基本的算法和数据结构
2.熟悉Linux/Unix操作系统，至少掌握一种后端编程语言(C++/Java/Scala等)
3.了解业界技术发展动向，并能够对新技术/新架构/新产品做出可行性评估
4.具有良好的自我驱动和学习能力，责任心强，不断追求卓越
5.具有优秀的发现问题和解决问题能力，对解决有挑战的问题充满热情
6.具有优秀的沟通和协调能力，具有同理心，能够站在不同角度思考问题
7.熟悉ElasticSearch/Hive/SparkSQL/Presto/Impala/Kylin/Druid/Doris等系统或者相关系统者优先，开源社区活跃贡献者优先
联系方式工作地点：武汉

简历投递：zhoukang1@xiaomi.com

邮件标题：姓名-小米计算平台-研发职位应聘，欢迎自荐或推荐

分布式计算研发工程师
职位描述
1. 负责小米云平台核心分布式系统Spark/Flink/Yarn/Doris的设计与研发工作；
2. 参与相关系统的线上运维工作，高效定位和解决线上问题，保证服务可用性并满足SLA要求；
3. 参与开源，提高小米在开源社区的影响力。
任职要求
1.扎实的计算机专业基础，熟悉基本的算法和数据结构
2.熟悉Linux/Unix操作系统，至少掌握一种后端编程语言(C++/Java/Scala等)
3.了解业界技术发展动向，并能够对新技术/新架构/新产品做出可行性评估
4.具有良好的自我驱动和学习能力，责任心强，不断追求卓越
5.具有优秀的发现问题和解决问题能力，对解决有挑战的问题充满热情
6.具有优秀的沟通和协调能力，具有同理心，能够站在不同角度思考问题
7.熟悉Hadoop/Spark/Flink/Kafka/Pulsar/Doris等系统或者相关系统者优先，开源社区活跃贡献者优先
联系方式工作地点：北京

简历投递：xiajun@xiaomi.com

邮件标题：姓名-小米计算平台-研发职位应聘，欢迎自荐或推荐

继续阅读 »

团队介绍
小米计算平台隶属于小米云平台事业部，负责支持小米集团各业务线计算产品的需求，愿景是提供一站式的计算平台服务。计算平台主要负责开发、改进和推广全公司的大数据分析处理基础架构，包括分布式搜索引擎ElasticSearch、消息中间件（Talos/EMQ/Kafka）和数据集成服务、离线资源调度（Yarn/Azkaban）、计算引擎服务（Flink/Spark）和作业管理平台、OLAP服务（Hive/Kylin/Doris/Druid）等服务。团队具有清晰的使命、优秀的成员、良好的学习氛围。期待对大数据基础架构感兴趣的新伙伴加入，共同成长。
OLAP平台开发工程师
职位描述
1.负责小米云平台 Hive/ElasticSearch 相关系统的研发和运维工作；
2.保障线上服务的高可用，并为此进行服务架构、部署架构、容灾预案等方面的优化；
3. 参与开源，提高小米在开源社区的影响力。
任职要求
1.扎实的计算机专业基础，熟悉基本的算法和数据结构
2.熟悉Linux/Unix操作系统，至少掌握一种后端编程语言(C++/Java/Scala等)
3.了解业界技术发展动向，并能够对新技术/新架构/新产品做出可行性评估
4.具有良好的自我驱动和学习能力，责任心强，不断追求卓越
5.具有优秀的发现问题和解决问题能力，对解决有挑战的问题充满热情
6.具有优秀的沟通和协调能力，具有同理心，能够站在不同角度思考问题
7.熟悉ElasticSearch/Hive/SparkSQL/Presto/Impala/Kylin/Druid/Doris等系统或者相关系统者优先，开源社区活跃贡献者优先
联系方式工作地点：武汉

简历投递：zhoukang1@xiaomi.com

邮件标题：姓名-小米计算平台-研发职位应聘，欢迎自荐或推荐

分布式计算研发工程师
职位描述
1. 负责小米云平台核心分布式系统Spark/Flink/Yarn/Doris的设计与研发工作；
2. 参与相关系统的线上运维工作，高效定位和解决线上问题，保证服务可用性并满足SLA要求；
3. 参与开源，提高小米在开源社区的影响力。
任职要求
1.扎实的计算机专业基础，熟悉基本的算法和数据结构
2.熟悉Linux/Unix操作系统，至少掌握一种后端编程语言(C++/Java/Scala等)
3.了解业界技术发展动向，并能够对新技术/新架构/新产品做出可行性评估
4.具有良好的自我驱动和学习能力，责任心强，不断追求卓越
5.具有优秀的发现问题和解决问题能力，对解决有挑战的问题充满热情
6.具有优秀的沟通和协调能力，具有同理心，能够站在不同角度思考问题
7.熟悉Hadoop/Spark/Flink/Kafka/Pulsar/Doris等系统或者相关系统者优先，开源社区活跃贡献者优先
联系方式工作地点：北京

简历投递：xiajun@xiaomi.com

邮件标题：姓名-小米计算平台-研发职位应聘，欢迎自荐或推荐收起阅读 »

类比mysql查询,适合新手学习Elasticsearch的DSL查询语句

Mysql查询与Elasticsearch的DSL查询语句对照

前言

一、Mysql数据库与Elasticsearch的类比

二、Mysql查询语句与DSL查询类比

2.1 search_lexicon 表结构

2.2 search_lexicon_v1 索引结构

2.3 查询语句对照

三、总结

Mysql查询与Elasticsearch的DSL查询语句对照

前言

一、Mysql数据库与Elasticsearch的类比

二、Mysql查询语句与DSL查询类比

2.1 search_lexicon 表结构

2.2 search_lexicon_v1 索引结构

2.3 查询语句对照

三、总结

社区日报第926期 (2020-04-28)

社区日报第925期 (2020-04-27)

社区日报第924期 (2020-04-26)

社区日报第923期 (2020-04-25）

社区日报第922期 (2020-04-24)

社区日报第921期 (2020-04-23)

社区日报第920期 (2020-04-22)

社区日报第919期 (2020-04-21)

社区日报第918期 (2020-04-20)

社区日报第917期 (2020-04-19)

社区日报第916期 (2020-04-18）

社区日报第915期 (2020-04-17)

社区日报第914期 (2020-04-16)

[社招]小米数据平台开发

活动推荐

热门文章

热门话题