你不会是程序猿吧?
倒排索引

倒排索引

喜报!极限科技新获得一项国家发明专利授权:“搜索数据库的正排索引处理方法、装置、介质和设备”

资讯动态INFINI Labs 小助手 发表了文章 • 0 个评论 • 2302 次浏览 • 2024-06-23 00:05 • 来自相关话题

近日,极限数据(北京)科技有限公司(简称:极限科技)新获得一项国家发明专利授权,专利名为 “搜索数据库的正排索引处理方法、装置、介质和设备”,专利号:ZL 2024 1 0479400.9,授权日为 2024 年 6 月 21 日,标志着极限科技在数据库搜索技术领域的自主创新能力再次得到国家级认可。

发明专利证书

创新技术,提升搜索效率

该专利的核心创新点在于将正排索引与倒排索引在逻辑上进行分离,通过专门设计的正排索引结构,实现了文档的高效写入。这种创新方法不仅提高了搜索过程的灵活性,而且使得正排索引结构能够支持实时搜索,避免了传统搜索技术中必须等待数据落盘后才能进行搜索的限制,从而显著提升了搜索效率。

自主研发,持续创新

极限科技自成立以来,始终坚持自主研发和技术创新的道路。公司的研发团队由一批经验丰富的工程师组成,他们在数据库技术、搜索引擎和大数据处理等领域拥有深厚的专业知识和实践经验。此次专利的获得,是极限科技在自主研发道路上的又一重要里程碑,展现了公司在技术创新方面的持续努力和卓越成就。

行业领先,未来可期

极限科技的这项发明专利不仅为公司带来了技术上的突破,也为整个行业的发展提供了新的思路和方向。随着大数据时代的到来,高效的搜索技术对于信息的快速获取和处理至关重要。极限科技的这一创新成果,有望推动相关行业的技术进步,为用户带来更加流畅和精准的搜索体验。

关于极限科技(INFINI Labs)

INFINI Labs

极限科技,全称极限数据(北京)科技有限公司,是一家专注于实时搜索与数据分析的软件公司。旗下品牌极限实验室(INFINI Labs)致力于打造极致易用的数据探索与分析体验。

极限科技是一支年轻的团队,采用天然分布式的方式来进行远程协作,员工分布在全球各地,希望通过努力成为中国乃至全球企业大数据实时搜索分析产品的首选,为中国技术品牌输出添砖加瓦。

官网:https://infinilabs.cn

联系我们

原文:https://infinilabs.cn/blog/2024/news-20240622/

社区日报 第1239期 (2021-11-3)

社区日报kin122 发表了文章 • 0 个评论 • 1255 次浏览 • 2021-11-03 14:25 • 来自相关话题

1. Elasticsearch 如何做到快速检索 - 倒排索引的秘密 https://mp.weixin.qq.com/s/Mq7wPOUmF35LhyaLqWew3Q 2. filebeat 收集 syslog 并自动归类 https://www.jianshu.com/p/de7c2e0d5767 3. Elasticsearch 快照仓库的内部结构 https://mp.weixin.qq.com/s/fDFy-i7dHQ08NhPYDMwoQw   编辑:kin122 归档:https://ela.st/cn-daily-all 订阅:https://ela.st/cn-daily-sub 沙龙:https://ela.st/cn-meetup
1. Elasticsearch 如何做到快速检索 - 倒排索引的秘密 https://mp.weixin.qq.com/s/Mq7wPOUmF35LhyaLqWew3Q 2. filebeat 收集 syslog 并自动归类 https://www.jianshu.com/p/de7c2e0d5767 3. Elasticsearch 快照仓库的内部结构 https://mp.weixin.qq.com/s/fDFy-i7dHQ08NhPYDMwoQw   编辑:kin122 归档:https://ela.st/cn-daily-all 订阅:https://ela.st/cn-daily-sub 沙龙:https://ela.st/cn-meetup

Segment 和 倒排索引的关系

ElasticsearchKevin_23 回复了问题 • 2 人关注 • 2 个回复 • 1687 次浏览 • 2021-10-28 08:50 • 来自相关话题

倒排索引对模糊查询是否有效

Elasticsearchfantuan 回复了问题 • 2 人关注 • 1 个回复 • 2591 次浏览 • 2019-08-06 15:52 • 来自相关话题

es建立倒排索引时如何区分字段的?倒排索引是token对应文档的集合,里面是否区分token匹配到一篇文档的哪些字段?

Elasticsearchweizijun 回复了问题 • 2 人关注 • 1 个回复 • 5477 次浏览 • 2018-11-16 12:46 • 来自相关话题

lucene倒排索引关于数据压缩的问题

Lucenezqc0512 回复了问题 • 6 人关注 • 3 个回复 • 4912 次浏览 • 2018-09-17 09:02 • 来自相关话题

倒排索引 数字和日期类型的问题

Elasticsearchcodepub 回复了问题 • 4 人关注 • 3 个回复 • 5874 次浏览 • 2018-04-23 17:10 • 来自相关话题

关于倒排索引中搜索结果合并不太理解的地方

Elasticsearchstrglee 回复了问题 • 3 人关注 • 1 个回复 • 3788 次浏览 • 2018-04-01 11:43 • 来自相关话题

elasticsearch 倒排索引

Elasticsearchkennywu76 回复了问题 • 2 人关注 • 1 个回复 • 6026 次浏览 • 2017-05-19 09:31 • 来自相关话题

条新动态, 点击查看
匿名用户

kennywu76 回答了问题 • 2017-12-18 11:06 • 3 个回复 不感兴趣

倒排索引 数字和日期类型的问题

赞同来自:

早期ES/Lucene版本是将数值转换成字符串形式,利用倒排表做查找的。 为了解决离散的数值多带来的查找性能问题,Lucene在编排倒排表的时候,比较巧妙的引入了一些特殊的Term,比如"
50x75=[doc40,doc41,doc53,doc78... 显示全部 »
早期ES/Lucene版本是将数值转换成字符串形式,利用倒排表做查找的。 为了解决离散的数值多带来的查找性能问题,Lucene在编排倒排表的时候,比较巧妙的引入了一些特殊的Term,比如"
50x75=[doc40,doc41,doc53,doc78,doc99,...]", 表示50-75这个范围的数值包含在后面哪些文档列表里。由此“
50 OR 51 OR 52 ... OR 100”这样的范围查找,被优化成类似“50x75 OR 76x99 OR 100"这样的形式。 对于该算法的详细解释参考:  https://blog.parse.ly/post/1691/lucene/  
 
从ES5.0版本(Lucene 6.0)开始,对于数值型字段,改用了k-d tree这种数据结构编码。 改用这种数据结构以后,数值型数据的索引以及范围查找效率比之前用倒排编码的方式提高很多。参考:  https://www.elastic.co/blog/lucene-points-6.0
 

Segment 和 倒排索引的关系

回复

ElasticsearchKevin_23 回复了问题 • 2 人关注 • 2 个回复 • 1687 次浏览 • 2021-10-28 08:50 • 来自相关话题

倒排索引对模糊查询是否有效

回复

Elasticsearchfantuan 回复了问题 • 2 人关注 • 1 个回复 • 2591 次浏览 • 2019-08-06 15:52 • 来自相关话题

es建立倒排索引时如何区分字段的?倒排索引是token对应文档的集合,里面是否区分token匹配到一篇文档的哪些字段?

回复

Elasticsearchweizijun 回复了问题 • 2 人关注 • 1 个回复 • 5477 次浏览 • 2018-11-16 12:46 • 来自相关话题

lucene倒排索引关于数据压缩的问题

回复

Lucenezqc0512 回复了问题 • 6 人关注 • 3 个回复 • 4912 次浏览 • 2018-09-17 09:02 • 来自相关话题

倒排索引 数字和日期类型的问题

回复

Elasticsearchcodepub 回复了问题 • 4 人关注 • 3 个回复 • 5874 次浏览 • 2018-04-23 17:10 • 来自相关话题

关于倒排索引中搜索结果合并不太理解的地方

回复

Elasticsearchstrglee 回复了问题 • 3 人关注 • 1 个回复 • 3788 次浏览 • 2018-04-01 11:43 • 来自相关话题

elasticsearch 倒排索引

回复

Elasticsearchkennywu76 回复了问题 • 2 人关注 • 1 个回复 • 6026 次浏览 • 2017-05-19 09:31 • 来自相关话题

喜报!极限科技新获得一项国家发明专利授权:“搜索数据库的正排索引处理方法、装置、介质和设备”

资讯动态INFINI Labs 小助手 发表了文章 • 0 个评论 • 2302 次浏览 • 2024-06-23 00:05 • 来自相关话题

近日,极限数据(北京)科技有限公司(简称:极限科技)新获得一项国家发明专利授权,专利名为 “搜索数据库的正排索引处理方法、装置、介质和设备”,专利号:ZL 2024 1 0479400.9,授权日为 2024 年 6 月 21 日,标志着极限科技在数据库搜索技术领域的自主创新能力再次得到国家级认可。

发明专利证书

创新技术,提升搜索效率

该专利的核心创新点在于将正排索引与倒排索引在逻辑上进行分离,通过专门设计的正排索引结构,实现了文档的高效写入。这种创新方法不仅提高了搜索过程的灵活性,而且使得正排索引结构能够支持实时搜索,避免了传统搜索技术中必须等待数据落盘后才能进行搜索的限制,从而显著提升了搜索效率。

自主研发,持续创新

极限科技自成立以来,始终坚持自主研发和技术创新的道路。公司的研发团队由一批经验丰富的工程师组成,他们在数据库技术、搜索引擎和大数据处理等领域拥有深厚的专业知识和实践经验。此次专利的获得,是极限科技在自主研发道路上的又一重要里程碑,展现了公司在技术创新方面的持续努力和卓越成就。

行业领先,未来可期

极限科技的这项发明专利不仅为公司带来了技术上的突破,也为整个行业的发展提供了新的思路和方向。随着大数据时代的到来,高效的搜索技术对于信息的快速获取和处理至关重要。极限科技的这一创新成果,有望推动相关行业的技术进步,为用户带来更加流畅和精准的搜索体验。

关于极限科技(INFINI Labs)

INFINI Labs

极限科技,全称极限数据(北京)科技有限公司,是一家专注于实时搜索与数据分析的软件公司。旗下品牌极限实验室(INFINI Labs)致力于打造极致易用的数据探索与分析体验。

极限科技是一支年轻的团队,采用天然分布式的方式来进行远程协作,员工分布在全球各地,希望通过努力成为中国乃至全球企业大数据实时搜索分析产品的首选,为中国技术品牌输出添砖加瓦。

官网:https://infinilabs.cn

联系我们

原文:https://infinilabs.cn/blog/2024/news-20240622/

社区日报 第1239期 (2021-11-3)

社区日报kin122 发表了文章 • 0 个评论 • 1255 次浏览 • 2021-11-03 14:25 • 来自相关话题

1. Elasticsearch 如何做到快速检索 - 倒排索引的秘密 https://mp.weixin.qq.com/s/Mq7wPOUmF35LhyaLqWew3Q 2. filebeat 收集 syslog 并自动归类 https://www.jianshu.com/p/de7c2e0d5767 3. Elasticsearch 快照仓库的内部结构 https://mp.weixin.qq.com/s/fDFy-i7dHQ08NhPYDMwoQw   编辑:kin122 归档:https://ela.st/cn-daily-all 订阅:https://ela.st/cn-daily-sub 沙龙:https://ela.st/cn-meetup
1. Elasticsearch 如何做到快速检索 - 倒排索引的秘密 https://mp.weixin.qq.com/s/Mq7wPOUmF35LhyaLqWew3Q 2. filebeat 收集 syslog 并自动归类 https://www.jianshu.com/p/de7c2e0d5767 3. Elasticsearch 快照仓库的内部结构 https://mp.weixin.qq.com/s/fDFy-i7dHQ08NhPYDMwoQw   编辑:kin122 归档:https://ela.st/cn-daily-all 订阅:https://ela.st/cn-daily-sub 沙龙:https://ela.st/cn-meetup