极限科技亮相 TDBC 2025 可信数据库发展大会——联合创始人曾嘉毅分享搜索型数据库生态建设新成果
资讯动态 • INFINI Labs 小助手 发表了文章 • 0 个评论 • 3192 次浏览 • 2025-07-18 15:35
2025 年 7 月 17 日 在北京召开的 TDBC 2025 可信数据库发展大会·数据库生态及国际化分论坛 上,全球数据库领域专家、学者与企业代表齐聚。极限数据(北京)科技有限公司联合创始人曾嘉毅发表《搜索型数据库生态建设及展望》主题演讲,剖析技术创新与实践,为行业提供高效数据检索与智能应用方案。

破解数据检索挑战,AI 赋能搜索升级
首先,我们需要面对结构化数据。典型处理方式是使用传统关系型数据库。但是,关系型数据库的设计初衷就决定了它面对的挑战:关系型数据库优先保证事务性,其数据分层结构导致查询需要层层下钻,同时传统关系型数据库能够处理的数据规模也是受限的。搜索型数据库针对以上挑战可以实现读写分离、多表聚合查询、数据库加速等。
与此同时,企业数据中大约 85% 为非结构化或半结构化数据,如图片、视频等,传统数据库处理困难。极限科技运用语义解析与 AI 向量化技术,语义解析深入理解数据语义并转化为结构化信息,AI 向量化将其映射到高维空间实现向量化表示,二者结合完成非结构化数据的标签提取与索引构建,提升检索准确性与效率。

针对中文文本,极限科技进行字段化处理研究。中文语法复杂、语义丰富,传统方法难以满足检索需求。公司通过自研算法精准分词与字段提取,结合向量化技术提升中文数据检索效果。同时,融合向量化全量搜索与模糊搜索,前者快速定位相似数据,后者处理用户输入的不准确信息,提高搜索容错性。
平台化建设与工具开源:打造全链路能力
极限科技构建的管控平台功能强大。支持多集群元原生编排和管理,企业可依业务场景和用户需求灵活调整集群资源,同时实现一键升级、备份管理等;提供统一监控、统一身份管理服务,实时监控系统组件与运行状态,及时预警问题。该平台兼容多厂商环境,企业可无缝集成现有系统,降低迁移成本与风险。公司开发的搜索服务网关针对检索服务提供流量分发与链路加速能力,进而实现查询分析、干预等高阶功能。

此外,极限科技积极推动搜索周边工具开源贡献。数据迁移工具 [ESM](https://github.com/medcl/esm) 助力企业快速安全迁移数据至自家搜索型数据库,缩短迁移周期、降低风险;性能压测工具 [Loadgen](https://github.com/infinilabs/loadgen) 模拟复杂场景测试系统性能,评估性能瓶颈与承载能力;中文分词工具 [IK](https://github.com/infinilabs/analysis-ik)/[Pinyin](https://github.com/infinilabs/analysis-pinyin) 支持多种分词模式与自定义词典,满足不同用户需求。开源工具促进技术交流创新,支持行业生态发展。
“Coco” AI 搜索与智能体结合模式:重构搜索体验
[Coco AI](https://coco.rs/) 采用获得国家专利设计的人机交互体验,将搜索与 AI 进行无缝结合。传统 RAG 存在大模型直接回答搜索问题存在训练成本高、回答不精准问题。 Coco AI 后台灵活,支持为不同类型问题分配专属“小助手”。“小助手”针对特定问题优化配置,精准理解用户意图、提供准确回答,降低训练成本、提升回答精准度与效率。可以快速量身打造企业专属的 AI 智能体工具箱。

Coco AI 结合本地与云端协同搜索技术,连接本地文件、数据库及外部应用系统数据源。用户搜索时,可以同时对本地和外部 Coco Server 引擎同时处理查询请求,然后对结果进行打分与整合去重排序,结合大模型总结分析最终结果,实现意图理解与统一信息获取,打破信息孤岛,提供全面准确高效的搜索服务。
展望未来:AI 搜索与开放生态
极限科技对搜索型数据库未来有清晰规划。下一代 AI 搜索架构将深度融合向量检索与智能体技术。向量检索已发挥重要作用,智能体技术能自主感知、决策与行动。二者融合使 AI 搜索系统更智能理解用户需求,主动提供个性化服务,如依历史记录推荐信息,面对复杂任务自主分解协调资源处理。
在企业数据应用场景上,下一代架构将进一步优化拓展。除传统文档检索、数据查询,还将深入生产、运营、管理等环节,提供全面深入的数据分析与决策支持。如在生产制造中实时分析设备数据、提前发现故障隐患;在市场营销中深度挖掘客户数据、制定精准营销策略。

为推动行业发展,极限科技将持续推进开源战略,通过 [GitHub](https://github.com/infinilabs/)/[Gitee](https://gitee.com/infinilabs/)/[GitCode](https://gitcode.com/infinilabs/) 等平台共享核心技术代码与文档,与全球开发者紧密合作。吸引更多开发者参与研发创新,共同解决技术难题。同时积极参与行业标准制定推广,促进市场规范化标准化发展,构建开放共享共赢的搜索型数据库生态。
此次分享展示了极限科技的技术实力与创新成果,为行业发展提供新思路方向。相信未来,极限科技将秉持创新、开放、合作理念,推动技术发展应用,为企业数字化转型与行业发展注入新动力。
【搜索客社区日报】第2078期 (2025-07-18)
社区日报 • Fred2000 发表了文章 • 0 个评论 • 3668 次浏览 • 2025-07-18 11:49
https://my.oschina.net/u/7209245/blog/18684967
2、Coco AI 快速构建本地文档知识库增强检索+智能问答系统
https://mp.weixin.qq.com/s/fcchZQm_FLuW_jhrZVwJlQ
3、一文了解 - Elasticsearch 搜索的底层原理-解析
https://mp.weixin.qq.com/s/06e_iIN43BgKVYJNAnmoLA
4、本地 RAG 实战:用 Easysearch + Ollama SDK 半小时搭建检索增强问答系统
https://mp.weixin.qq.com/s/G4Wk_A7G7QiZIQpjCYJ1kw
5、会 Vibe Coding(氛围编程) 的同事:我一个人干掉整个技术部!
https://mp.weixin.qq.com/s/1nV-3YCPBJcnpNasb_fN3A
编辑:Fred
更多资讯:http://news.searchkit.cn
极限科技亮相 TDBC 2025 可信数据库发展大会,连续三年荣誉入选信通院《中国数据库产业图谱》
资讯动态 • INFINI Labs 小助手 发表了文章 • 0 个评论 • 2361 次浏览 • 2025-07-18 11:49
2025 年 7 月 16 日,由中国通信标准化协会主办、中国信息通信研究院(以下简称“中国信通院”)承办的“TDBC 2025 可信数据库发展大会”在北京隆重召开。作为我国数据库领域的年度权威盛会,本次大会以“自主·创新·引领”为主题,聚焦数据库技术创新与产业实践,发布了多项前沿研究成果,并深入探讨了行业发展趋势。极限科技受邀参会,并凭借在搜索型数据库领域的突出表现,连续三年荣誉入选《中国数据库产业图谱(2025 年)》,再次彰显其技术实力与市场影响力。

权威盛会聚焦技术前沿,共绘产业新蓝图
TDBC 2025 可信数据库发展大会是我国数据库行业规格最高、影响力最广的年度盛会之一。本届大会汇聚了政府主管部门、行业领袖、科研机构及企业代表,围绕数据库核心技术突破、行业应用落地、生态协同发展等议题展开深度交流。中国信通院在会上发布了一系列重磅研究成果,其中《中国数据库产业图谱》作为全面展示国内数据库产业生态的权威报告,备受业界关注。
极限科技连续三年入选产业图谱,搜索型数据库代表获权威认可
《中国数据库产业图谱(2025 年)》由中国信通院基于产品技术能力、产业服务水平、市场表现及生态建设等多维度综合评估编制,旨在为行业用户提供选型参考,推动资源向优质企业集聚。极限科技作为搜索型数据库的代表企业之一,凭借其自主研发的分布式搜索分析引擎、高性能实时数据处理能力,以及在金融、政务、能源等关键行业的深度实践,连续三年荣誉入选图谱,并收录于搜索型数据库及数据库生态社区技术社区版块,成为数据库产业生态中的标杆企业。

图:极限科技荣誉入选中国信通院《中国数据库产业图谱(2025 年)》
极限科技相关负责人表示:“连续三年入选产业图谱,既是行业对极限科技技术实力的肯定,也是我们持续深耕搜索型数据库领域的动力。未来,我们将继续坚持自主创新,深化技术突破,为行业客户提供更高效、更智能的数据检索与分析解决方案。”
以自主创新为引擎,引领搜索型数据库高质量发展
当前,随着企业数字化转型的加速,海量数据的实时检索与智能分析已成为刚需。极限科技聚焦搜索型数据库核心技术,通过分布式架构、AI 融合、云原生等技术创新,打造了覆盖数据全生命周期的产品矩阵。其核心产品支持 PB 级数据秒级响应,并具备高可用、弹性扩展等特性,已在多个国家级项目中落地应用,助力客户实现数据治理能力与业务效能的双重提升。

此次大会上,极限科技还与业界同仁共同探讨了搜索型数据库如何支撑数字经济高质量发展。与会专家指出,随着数据要素价值的加速释放,搜索型数据库作为挖掘数据价值的关键工具,其自主创新水平直接关系到国家数据安全与产业竞争力。极限科技的实践为行业提供了可复制的范本,彰显了中国数据库企业的责任与担当。
展望未来:携手生态伙伴,共筑可信数据底座
极限科技表示,未来将持续深化与中国信通院等权威机构的合作,积极参与标准制定与生态共建,推动搜索型数据库技术与产业需求的深度融合。同时,公司将加大研发投入,探索数据库与人工智能等新技术的协同创新,为构建安全、高效、智能的数据基础设施贡献力量。
TDBC 2025 可信数据库发展大会的圆满落幕,标志着我国数据库产业迈向更高水平的自主创新阶段。极限科技将以此次入选产业图谱为契机,携手行业伙伴,共同书写中国数据库产业的新篇章。
【搜索客社区日报】第2077期 (2025-07-17)
社区日报 • Se7en 发表了文章 • 0 个评论 • 2683 次浏览 • 2025-07-17 14:31
https://mp.weixin.qq.com/s/9l1Uupthv9zBqvo5v_N94g
2.AWS Kiro 最懂程序员的IDE - SPEC模式初体验,稳得出人意料!
https://www.bilibili.com/video/BV18vgwzYEri/
3.Chunked-Prefills 分块预填充机制详解
https://mp.weixin.qq.com/s/JIvbYapMMtC8JkBEXHsG-A
编辑:Se7en
更多资讯:http://news.searchkit.cn
【搜索客社区日报】第2076期 (2025-07-16)
社区日报 • kin122 发表了文章 • 0 个评论 • 3061 次浏览 • 2025-07-16 08:59
https://mp.weixin.qq.com/s/fC3iNOSWlSnofRM804RYOQ
2.森马服饰从 Elasticsearch 到阿里云 SelectDB 的架构演进之路
https://zhuanlan.zhihu.com/p/1927036355139045220
3.RAG 的最佳 PDF 提取器是什么?(搭梯)
https://levelup.gitconnected.c ... b06e0
编辑:kin122
更多资讯:http://news.searchkit.cn
【搜索客社区日报】第2075期 (2025-07-15)
社区日报 • God_lockin 发表了文章 • 0 个评论 • 3152 次浏览 • 2025-07-15 13:33
https://medium.com/%40imadsadd ... 90485
2. 10亿记录一秒返回,干就完了(需要梯子)
https://medium.com/%40ApacheDo ... e3a12
3. 我在Trendyol我们是这样用ES做聚合的(需要梯子)
https://medium.com/trendyol-te ... 1c4b2
编辑:斯蒂文
更多资讯:http://news.searchkit.cn
TDBC 2025 可信数据库发展大会,极限科技邀您来赴约!
活动 • INFINI Labs 小助手 发表了文章 • 0 个评论 • 2667 次浏览 • 2025-07-14 18:52

2025 年 7 月 16-17 日,「TDBC 2025 可信数据库发展大会」将在北京朝阳悠唐皇冠假日酒店隆重召开。大会由中国通信标准化协会主办,中国信息通信研究院、中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)承办。
本次大会 极限科技 再度受邀,创始人兼总经理曾勇、联合创始人曾嘉毅 将分别于「人工智能与数据库融合发展分论坛」、「数据库生态及国际化分论坛」发表主题演讲,与大家共同探讨 AI 与企业搜索融合发展的技术突破和应用实践,以及企业搜索的发展新方向与海外市场开拓。与此同时我们也特设 展台(展位号 B09) 和大家线下相见!
演讲主题一:《重构信息获取方式:下一代企业搜索与 AI 的融合探索》

演讲主题二:《搜索型数据库生态建设和展望》

展位福利
除了精彩演讲,极限科技专家团队将于 B09 (记住展位号,不迷路!)与大家近距离交流。大家可以深入了解搜索型数据库与 AI 搜索的产品技术、行业解决方案,并与技术专家一对一探讨实际业务场景中的搜索应用问题。

此外,我们还精心准备了多款 INFINI Labs 定制周边礼品,只要来到展位参与互动就有机会获得,真诚欢迎各位新老朋友前来 B09 展位打卡交流!
大会议程
[2025 可信数据库发展大会全议程公布!](https://mp.weixin.qq.com/s/W80_IpqmAD8jnDNvVQoOZA)
关于极限科技(INFINI Labs)

极限科技,全称极限数据(北京)科技有限公司,是一家专注于实时搜索与数据分析的软件公司。旗下品牌极限实验室(INFINI Labs)致力于打造极致易用的数据探索与分析体验。
极限科技是一支年轻的团队,采用天然分布式的方式来进行远程协作,员工分布在全球各地,希望通过努力成为中国乃至全球企业大数据实时搜索分析产品的首选,为中国技术品牌输出添砖加瓦。
官网:<https://infinilabs.cn>
【搜索客社区日报】第2074期 (2025-07-14)
社区日报 • Muses 发表了文章 • 0 个评论 • 3276 次浏览 • 2025-07-14 13:12
https://elasticstack.blog.csdn ... 73363
2、使用 Maximum Marginal Relevance 实现搜索结果多样化
https://elasticstack.blog.csdn ... 69341
3、上下文更长 ≠ 更好:为什么 RAG 仍然重要
https://elasticstack.blog.csdn ... 88509
4、Logstash 9.x 与早期版本差异及常见问题解决方案
https://mp.weixin.qq.com/s/08dzlC5wKsfi_5JkaSN26Q
5、ChatBI:让数据分析像聊天一样简单!
https://mp.weixin.qq.com/s/W8sEEIphNE7ot5T2oY5qVA
编辑:Muse
更多资讯:http://news.searchkit.cn
极限科技荣获 2025 上海开源创新菁英荟「开源创新新星企业」奖
资讯动态 • INFINI Labs 小助手 发表了文章 • 0 个评论 • 2731 次浏览 • 2025-07-13 11:13
2025 年 6 月 28 日,由上海开源信息技术协会主办、上海对外经贸大学承办的“[2025 上海开源创新菁英荟](https://mp.weixin.qq.com/s/7DK4r_kz33c3xxtgNGjBuQ)”圆满落幕。本届大会以“开源有 AI,智领千行”为主题,汇聚开源社区、科研机构及产业界 200 余位专家,共同探讨开源技术如何赋能千行百业智能化转型。会上揭晓了四大类奖项,极限科技凭借其开源项目 Coco AI 脱颖而出,荣获「开源创新新星企业」奖项,得到了行业权威认可。


统一搜索 + 私有部署,Coco AI 直击企业三大痛点
现代企业面临数据分散、安全风险高、知识利用率低三大核心痛点。Coco AI 作为一款完全开源、跨平台的企业级智能搜索与助手系统,通过三大创新解决行业难题:
- 统一搜索入口,跨平台连接数据
支持连接本地文件、云存储(S3)、协作工具(Notion、Google Workspace)、知识平台(语雀)、代码仓库(GitHub)等多种数据源,实现一站式搜索与信息聚合。 - 私有化部署,保障数据安全
完全开源且支持自主可控部署,数据全程留存于企业内网,满足高安全、高合规场景需求。 - 融合大模型,构建智能助手
接入 DeepSeek、通义千问等先进大模型,支持语义理解、自然语言问答、智能推荐,激活沉睡数据,打造真正“会思考”的企业知识中枢。
开源生态赋能,推动 AI 普惠化
作为国内少数以搜索技术为核心的初创企业,极限科技始终践行“让搜索更简单”的使命。其开源项目 Coco AI(MIT 许可证)允许自由修改与分发,服务端(AGPL-3.0)要求公开源代码以确保合规,降低企业使用门槛。通过开源生态与 AI 技术,将企业离散数据转化为可搜索、可问答、可决策的活资产。
未来展望:躬身开源,共筑智能时代
此次获奖不仅是对极限科技在开源领域创新实践的高度认可,更是对其未来发展的激励。极限科技将继续积极投身开源实践,不断优化和创新 Coco AI,为更多企业提供高效、安全、智能的解决方案,推动企业从“数据沉睡时代”迈向“知识智能时代”。同时,极限科技还将加强与开源社区的合作,吸引更多开发者参与开源项目的开发和维护,共同推动开源技术的发展和应用。
关于 Coco AI - 为现代团队打造的统一搜索与 AI 智能助手
Coco AI 是一款完全开源、跨平台的企业级智能搜索与助手系统,专为现代企业打造。它通过统一搜索入口,连接企业内外部的异构数据源,融合大模型能力,帮助团队高效访问知识,智能决策协作。
官网:[https://coco.rs](https://coco.rs)
GitHub:[https://github.com/infinilabs](https://github.com/infinilabs)
【搜索客社区日报】第2073期 (2025-07-11)
社区日报 • Fred2000 发表了文章 • 0 个评论 • 2753 次浏览 • 2025-07-11 11:10
https://my.oschina.net/u/58463 ... 84272
2、Elasticsearch 在滴滴的应用与实践
https://mp.weixin.qq.com/s/nSnRH9MaG1_klI2IOJ_FuQ
3、OpenSearch 3.0发布,支持向量类型和MCP协议
https://mp.weixin.qq.com/s/Ge8-VEhN3tJf5aoU8X98RA
4、使用 Docker Compose 简化 INFINI Console 与 Easysearch 环境搭建
https://infinilabs.cn/blog/202 ... pose/
5、AI 深度研究(Deep Research)原理解析
https://my.oschina.net/u/58463 ... 83971
编辑:Fred
更多资讯:http://news.searchkit.cn
【搜索客社区日报】第2072期 (2025-07-10)
社区日报 • Se7en 发表了文章 • 0 个评论 • 2611 次浏览 • 2025-07-10 13:31
https://mp.weixin.qq.com/s/d0or_1U4TLVUKpK0vZAl2A
2.PerfTracker:万卡 GPU 集群超大规模训练性能问题定位利器!100万GPU 定位仅 3 分钟,7 分钟端到端性能诊断
https://mp.weixin.qq.com/s/YEs41WBJOY6hAG_G7Luf7A
3.OME:用模型驱动架构革新 LLM 基础设施
https://lmsys.org/blog/2025-07-08-ome
编辑:Se7en
更多资讯:http://news.searchkit.cn
【搜索客社区日报】第2070期 (2025-07-08)
社区日报 • God_lockin 发表了文章 • 0 个评论 • 2592 次浏览 • 2025-07-09 14:06
https://satorsight.medium.com/ ... 5c536
2. 用docker构建elastic 全家(需要梯子)
https://medium.com/%40kaviaras ... acb13
3. 不用es,直接用nodejs手搓搜索引擎行吗?(需要梯子)
https://leapcell.medium.com/st ... 86f28
编辑:斯蒂文
更多资讯:http://news.searchkit.cn
【搜索客社区日报】第2071期 (2025-07-9)
社区日报 • kin122 发表了文章 • 0 个评论 • 2218 次浏览 • 2025-07-09 14:06
https://medium.com/data-scienc ... 35d27
2.Cursor 如何每秒处理一百万次矢量搜索查询(搭梯)
https://medium.com/kx-systems/ ... 06ec1
3.以视觉答案为基础的多模态 RAG(搭梯)
https://medium.com/data-scienc ... 86c88
编辑:kin122
更多资讯:http://news.searchkit.cn
【搜索客社区日报】第2069期 (2025-07-07)
社区日报 • Muses 发表了文章 • 0 个评论 • 2321 次浏览 • 2025-07-07 23:47
https://mp.weixin.qq.com/s/XxlLMXAOVI9mTpkUIMmlQw
2、Elasticsearch 排序性能提升高达 900 倍
https://mp.weixin.qq.com/s/OAVYa_w0fAug9AiwdWPkeg
3、三个数据处理技巧,永远改变你的搜索体验
https://mp.weixin.qq.com/s/9p9rZwEI4Mieimw3cJWjxg
4、Elasticsearch:在 Elastic 中玩转 DeepSeek R1 来实现 RAG 应用
https://mp.weixin.qq.com/s/ia92pszO8ed98D4vOZ57pQ
5、使用 collapse 和 cardinality 实现高效分页在 Elasticsearch 中
https://elasticstack.blog.csdn ... 32271
编辑:Muse
更多资讯:http://news.searchkit.cn
【搜索客社区日报】第2068期 (2025-07-03)
社区日报 • Se7en 发表了文章 • 0 个评论 • 2794 次浏览 • 2025-07-03 17:31
https://mp.weixin.qq.com/s/CoFyJMX7cHEKUFSSbKtvZQ
2.14G 显存跑动千亿大模型!基于 KTransformers 的 DeepSeek-R1'满血版'实战
https://mp.weixin.qq.com/s/XIsVYxQgp2tCbWHFFb95xg
3.Muon作者仅用一篇博客,就被OpenAI看中了
https://mp.weixin.qq.com/s/Ijez32vojwSuyJkycKJQ9g
编辑:Se7en
更多资讯:http://news.searchkit.cn