要不要也来分享分享一下啊

elasticsearch5.5配置问题

locatelli 回复了问题 • 3 人关注 • 2 个回复 • 1619 次浏览 • 2018-02-03 01:05 • 来自相关话题

大家客户端都是使用的是什么 sping-data-elasticsearch 还是jest 还是restClient

回复

rommr 发起了问题 • 1 人关注 • 0 个回复 • 1889 次浏览 • 2018-02-02 18:01 • 来自相关话题

大神们好,我现在把一个词加入到ext_dict词库中,然后update了几篇文章,但是根据term查询的时候却查不到,这个是怎么回事啊?

laoyang360 回复了问题 • 3 人关注 • 1 个回复 • 1912 次浏览 • 2018-02-02 19:09 • 来自相关话题

请问 我有一个注册索引和一个登陆索引,我想查注册登陆,该怎么查询

laoyang360 回复了问题 • 3 人关注 • 1 个回复 • 1839 次浏览 • 2018-02-02 19:10 • 来自相关话题

Java API [6.1] 查询 setSource顺序不同得到结果不同

medcl 回复了问题 • 2 人关注 • 1 个回复 • 3060 次浏览 • 2018-02-10 17:11 • 来自相关话题

各位大牛,求问本地测试ES6.0版本,使用rally压测,测试geonames为何性能很差

回复

zhangj793 发起了问题 • 3 人关注 • 0 个回复 • 1955 次浏览 • 2018-02-02 11:34 • 来自相关话题

关于nodeingest时间戳问题

回复

moqi 回复了问题 • 1 人关注 • 1 个回复 • 2748 次浏览 • 2018-02-02 11:07 • 来自相关话题

关于es jest大家有好的使用文档说明吗

laoyang360 回复了问题 • 2 人关注 • 1 个回复 • 2895 次浏览 • 2018-02-02 19:05 • 来自相关话题

自定义的插件如何读取es中的索引,应该调用什么接口?

shiyuan 回复了问题 • 2 人关注 • 1 个回复 • 2157 次浏览 • 2018-02-04 13:25 • 来自相关话题

现在有查询的需求sql >>avg(endTime - startTime)的转化找了好久没头绪,求大神之招

shiyuan 回复了问题 • 2 人关注 • 1 个回复 • 1791 次浏览 • 2018-02-01 18:30 • 来自相关话题

disable _all field对于query_string的影响

rockybean 回复了问题 • 4 人关注 • 2 个回复 • 1904 次浏览 • 2018-02-01 20:55 • 来自相关话题

索引映射与分析整理

jhonbo 发表了文章 • 1 个评论 • 2702 次浏览 • 2018-02-01 17:29 • 来自相关话题

索引相关
一、映射与分析
Elasticsearch 中的数据可以概括的分为两类:精确值和全文。
为了促进在全文域中的匹配查询,Elasticsearch 首先 分析 文档,之后根据结果创建 倒排索引;

倒排索引:倒排索引源于实际应用中需要根据属性的值来查找记录。这种索引表中的每一项都包
括一个属性值和具有该属性值的各记录的地址。由于不是由记录来确定属性值,而是由属性值来
确定记录的位置,因而称为倒排索引(inverted index)。带有倒排索引的文件我们称为倒排索引文
件,简称倒排文件(inverted file)。

分析器:字符过滤器
首先,字符串按顺序通过每个 字符过滤器 。他们的任务是在分词前整理字符串。
一个字符过滤器可以用来去掉HTML,或者将 & 转化成 `and`。

分词器:
其次,字符串被 分词器 分为单个的词条。一个简单的分词器遇到空格和标点的时
候,可能会将文本拆分成词条。

Token 过滤器:
最后,词条按顺序通过每个 token 过滤器 。这个过程可能会改变词条(例如,小
写化 Quick ),删除词条(例如, 像 a`, `and`, `the 等无用词),或者增加
词条(例如,像 jump 和 leap 这种同义词)
当我们 索引 一个文档时使用分析器,它的全文域被分析成词条以用来创建倒排索引当你查询一个 全文 域时, 会对查询字符串应用相同的分析器,以产生正确的搜索词条列表。
当你查询一个 精确值 域时,不会分析查询字符串, 而是搜索你指定的精确值。

elastic内置的分析器:standard,whitespace,simple,english

创建一个自定义分析器编辑:
PUT /my_index
{
"settings": {
//配置自定义的分析器
 "analysis": { "char_filter": {
                                           "&_to_and": {
                                                                "type": "mapping",
                                                                "mappings": [ "&=> and "]
                                                               }
                                         },
                    "filter": {
                                    "my_stopwords": {
                                                                  "type": "stop",
                                                                  "stopwords": [ "the", "a" ]
                                                                 }
                                 },
 "analyzer": {
//自定义的分析器
"my_analyzer": { "type": "custom",
//字符过滤器
"char_filter": [ "html_strip", "&_to_and" ],
//分词器
"tokenizer": "standard",
//Token过滤器
"filter": [ "lowercase", "my_stopwords" ] }}
     }
   }
}

应用分析器:
PUT /my_index/_mapping/my_type
 { "properties": { "title": { "type": "string", "analyzer": "my_analyzer" } } }

映射:让elasticsearch知道索引的据类型
基本类型:
字符串: string
整数 : byte, short, integer, long
浮点数: float, double
布尔型: boolean
日期: date

查看映射:GET /gb/_mapping/tweet
     取得索引 gb 中类型 tweet 的映射

域最重要的属性是 type 。对于不是 string 的域,你一般只需要设置 type;
string 域映射的两个最重要 属性是 index 和 analyzer
index:
analyzed
首先分析字符串,然后索引它。换句话说,以全文索引这个域。
not_analyzed
  索引这个域,所以它能够被搜索,但索引的是精确值。不会对它进行分析。
no
不索引这个域。这个域不会被搜索到
analyzer:指定在搜索和索引时使用的分析器,可以使用内置的分析器或者自定义的分析器

自定义映射:
PUT /gb
{ "mappings": {
                       "tweet" : {
                                      "properties" : {
                                                              "tweet" : { "type" : "string", "analyzer": "english" },
                                                              "date" : { "type" : "date" },
                                                              "name" : { "type" : "string" },
                                                              "user_id" : { "type" : "long" }
                                                             }
                                    }
                     }
 }



二、索引别名和零宕机
A.PUT /my_index_v1
B.PUT /my_index_v1/_alias/my_index
A创建索引,B建立别名
修改索引字段时,可以新建索引,然后将就索引数据导入新建索引,将别名指向新建索引即可实现
0宕机变更索引了

参考官方文档:https://www.elastic.co/guide/c ... iases




 

maven项目引入6.1.2的elasticsearch,但是找不到InetSocketTransportAddress,需要引用什么

thislj 回复了问题 • 3 人关注 • 2 个回复 • 8696 次浏览 • 2018-06-06 12:19 • 来自相关话题

我来发一贴,公司不给你硬件(服务器)集群如何破

medcl 回复了问题 • 3 人关注 • 2 个回复 • 2131 次浏览 • 2018-02-01 22:19 • 来自相关话题

linux环境下启动es很慢

mj4ever 回复了问题 • 6 人关注 • 5 个回复 • 6950 次浏览 • 2019-10-18 12:08 • 来自相关话题