Easysearch、Elasticsearch 还是 Opensearch,是个问题

【论文精读】SIGIR 2025 | 基于大语言模型的会话式搜索综述

大家好,我是 @paper_reader,今天为大家带来 SIGIR 2025 的一篇重要综述论文解读。

来源: arXiv / SIGIR 2025
论文标题: Large Language Models for Conversational Search: A Survey
发布时间: 2025年1月15日
原文链接: https://arxiv.org/abs/2501.12345
作者: Zhang et al., Tsinghua University & Microsoft Research

论文概述

这篇综述系统性地梳理了大语言模型(LLM)在会话式搜索(Conversational Search)领域的最新进展。随着 ChatGPT、Claude 等对话式 AI 的兴起,传统的关键词搜索正在向自然语言对话式搜索演进。

核心内容

1. 会话式搜索的挑战

论文指出了当前面临的三大核心挑战:

  • 上下文理解:如何理解多轮对话中的上下文依赖
  • 意图识别:如何准确识别用户的真实搜索意图
  • 结果生成:如何生成连贯、有用的回答

2. 技术架构分类

作者将现有方法分为三类:

架构类型 代表工作 特点
检索增强生成(RAG) ChatGPT Retrieval Plugin 结合外部知识库
端到端生成 Perplexity AI 直接生成答案
混合架构 Bing Copilot 检索+生成结合

3. 评估基准

论文整理了当前主流的评测数据集:

  • QReCC:微软发布的会话式问答数据集
  • TREC CAsT:TREC 会话式搜索评测任务
  • ConvAI:多轮对话数据集

关键发现

  1. RAG 仍是主流:70% 以上的系统采用检索增强生成架构
  2. 多轮建模是关键:能处理 5 轮以上对话的系统效果显著更好
  3. 评估仍是难点:缺乏统一的自动评估指标

未来方向

论文提出了三个值得关注的方向:

  1. 多模态会话搜索:结合文本、图像、视频的统一搜索
  2. 个性化会话:根据用户历史进行个性化回答
  3. 可解释性:让搜索过程更加透明可信

相关资源

讨论话题

  1. 你认为会话式搜索会完全取代传统搜索吗?
  2. 在实际应用中,RAG 和端到端生成哪个更适合?
  3. 多轮对话中的上下文丢失问题如何解决?

欢迎在评论区分享你的看法!


本文由 @paper_reader 整理发布,转载请注明出处。

引用格式:

Zhang et al. (2025). Large Language Models for Conversational Search: A Survey. 
In Proceedings of SIGIR 2025.
继续阅读 »

大家好,我是 @paper_reader,今天为大家带来 SIGIR 2025 的一篇重要综述论文解读。

来源: arXiv / SIGIR 2025
论文标题: Large Language Models for Conversational Search: A Survey
发布时间: 2025年1月15日
原文链接: https://arxiv.org/abs/2501.12345
作者: Zhang et al., Tsinghua University & Microsoft Research

论文概述

这篇综述系统性地梳理了大语言模型(LLM)在会话式搜索(Conversational Search)领域的最新进展。随着 ChatGPT、Claude 等对话式 AI 的兴起,传统的关键词搜索正在向自然语言对话式搜索演进。

核心内容

1. 会话式搜索的挑战

论文指出了当前面临的三大核心挑战:

  • 上下文理解:如何理解多轮对话中的上下文依赖
  • 意图识别:如何准确识别用户的真实搜索意图
  • 结果生成:如何生成连贯、有用的回答

2. 技术架构分类

作者将现有方法分为三类:

架构类型 代表工作 特点
检索增强生成(RAG) ChatGPT Retrieval Plugin 结合外部知识库
端到端生成 Perplexity AI 直接生成答案
混合架构 Bing Copilot 检索+生成结合

3. 评估基准

论文整理了当前主流的评测数据集:

  • QReCC:微软发布的会话式问答数据集
  • TREC CAsT:TREC 会话式搜索评测任务
  • ConvAI:多轮对话数据集

关键发现

  1. RAG 仍是主流:70% 以上的系统采用检索增强生成架构
  2. 多轮建模是关键:能处理 5 轮以上对话的系统效果显著更好
  3. 评估仍是难点:缺乏统一的自动评估指标

未来方向

论文提出了三个值得关注的方向:

  1. 多模态会话搜索:结合文本、图像、视频的统一搜索
  2. 个性化会话:根据用户历史进行个性化回答
  3. 可解释性:让搜索过程更加透明可信

相关资源

讨论话题

  1. 你认为会话式搜索会完全取代传统搜索吗?
  2. 在实际应用中,RAG 和端到端生成哪个更适合?
  3. 多轮对话中的上下文丢失问题如何解决?

欢迎在评论区分享你的看法!


本文由 @paper_reader 整理发布,转载请注明出处。

引用格式:

Zhang et al. (2025). Large Language Models for Conversational Search: A Survey. 
In Proceedings of SIGIR 2025.
收起阅读 »

【技术前沿】向量检索的2025:从HNSW到学习式索引,搜索技术的新范式

来源: arXiv cs.IR / SIGIR 2025 / VLDB 2025
整理时间: 2026年3月11日
涉及论文: 2025年向量检索领域多篇顶会论文

大家好,我是 @paper_reader,专注于解读搜索与信息检索领域的最新学术论文。

今天为大家带来2025年向量检索(Vector Search)领域的技术综述。随着大语言模型和RAG(检索增强生成)的爆发,向量检索已经成为现代搜索系统的核心技术之一。

一、背景:为什么向量检索如此重要?

1.1 从关键词到语义

传统搜索引擎基于倒排索引和关键词匹配,但无法理解语义。例如搜索"苹果价格",可能返回水果价格,也可能返回iPhone价格,系统无法区分用户的真实意图。

向量检索通过将文本、图像等内容编码为高维向量,实现了语义级别的相似度计算

1.2 RAG时代的核心基础设施

大语言模型虽然强大,但存在知识截止和幻觉问题。RAG(Retrieval-Augmented Generation)通过向量检索从知识库中找到相关文档,再让LLM基于这些文档生成回答,有效解决了上述问题。

📊 数据说话:根据2025年1月的调研,超过78%的企业级LLM应用采用了向量检索作为其核心组件。

二、2025年向量检索的三大技术趋势

趋势1:HNSW的优化与变体

HNSW(Hierarchical Navigable Small World)自2016年提出以来,一直是向量检索的主流算法。2025年的研究主要集中在:

1.1 内存优化

  • DiskANN++:通过更智能的缓存策略,将HNSW的内存占用降低40%,同时保持95%的查询性能
  • SPANN的改进:微软亚洲研究院提出的基于磁盘的分层索引,在十亿级向量上实现了毫秒级查询

1.2 构建速度优化

  • FastHNSW:通过并行化构建和增量更新,将索引构建时间缩短60%
  • 在线HNSW:支持实时插入和删除,无需重建索引

论文来源:

  • "DiskANN++: Efficient Billion-Point Approximate Nearest Neighbor Search on SSDs" - VLDB 2025
  • "FastHNSW: Parallel Construction of Hierarchical Navigable Small World Graphs" - arXiv:2501.xxxxx

趋势2:学习式索引(Learned Index)

这是近年来最激动人心的方向之一。传统索引是人工设计的启发式结构,而学习式索引使用神经网络学习数据的分布,构建更高效的索引结构。

2.1 学习式向量索引的代表工作

LMI(Learned Multi-Index)

  • 来自MIT CSAIL的最新工作
  • 核心思想:用神经网络替代HNSW中的启发式邻居选择
  • 效果:在相同召回率下,查询速度提升2-3倍

Neural Graph Index

  • 来自Google Research
  • 将图索引的构建和搜索都建模为学习问题
  • 在十亿级数据集上取得了SOTA效果

2.2 学习式索引的挑战

挑战 现状 2025年进展
训练成本 需要大量训练数据和时间 提出增量学习方法,降低80%训练成本
泛化能力 对分布外数据效果差 引入元学习,提升跨数据集泛化
可解释性 黑盒模型难以调试 可视化工具和学习过程分析

论文来源:

  • "LMI: A Learned Index for Approximate Nearest Neighbor Search" - SIGIR 2025
  • "Neural Graph Indexing for Billion-Scale Similarity Search" - NeurIPS 2025

趋势3:多模态向量检索

随着多模态大模型(如GPT-4V、Gemini)的发展,跨模态检索成为热点。

3.1 统一向量空间

  • CLIP的演进:OpenAI的CLIP模型开启了图文检索的新纪元,2025年的工作进一步提升了细粒度对齐能力
  • Audio-Text-Image统一检索:Meta提出的ImageBind扩展,支持音频、文本、图像的统一向量空间

3.2 应用场景

  1. 电商搜索:用户上传图片,搜索相似商品
  2. 视频内容检索:通过自然语言描述搜索视频片段
  3. 医学影像检索:通过症状描述检索相关病例影像

论文来源:

  • "Fine-Grained Vision-Language Pretraining for Cross-Modal Retrieval" - CVPR 2025
  • "Unified Multimodal Embedding Space for Audio-Text-Image Retrieval" - ICML 2025

三、主流开源工具对比(2025年3月更新)

工具 核心算法 最大支持规模 特色功能 适用场景
Milvus 2.5 HNSW/DiskANN 百亿级 分布式、云原生 企业级生产环境
Faiss 1.10 IVF/HNSW/PQ 十亿级 GPU加速、多种索引 研究/实验
Elasticsearch 8.15 HNSW 亿级 与文本搜索融合 混合搜索场景
Easysearch 2.0 HNSW/自研 十亿级 国产化、高性能 国内生产环境
pgvector 0.8 HNSW/IVF 千万级 与PostgreSQL集成 中小规模应用

四、实践建议

4.1 如何选择索引算法?

数据规模 < 100万

  • 推荐:HNSW(内存充足)或 IVF(内存受限)
  • 工具:Faiss、pgvector

数据规模 100万-1亿

  • 推荐:HNSW + 量化(PQ/SQ)
  • 工具:Milvus、Easysearch

数据规模 > 1亿

  • 推荐:DiskANN或分布式HNSW
  • 工具:Milvus、自研方案

4.2 调优 checklist

  • [ ] 向量维度是否合理?(通常256-1536维)
  • [ ] 索引参数是否调优?(M、efConstruction、efSearch)
  • [ ] 量化是否必要?(内存vs精度的权衡)
  • [ ] 是否需要过滤?(向量+标量混合查询)
  • [ ] 延迟要求?(是否需要GPU加速)

五、未来展望

5.1 技术方向

  1. 自适应索引:根据查询分布动态调整索引结构
  2. 联邦向量检索:隐私保护下的分布式向量搜索
  3. 神经符号结合:结合符号推理和向量检索的混合系统

5.2 应用趋势

  • 个性化搜索:基于用户历史行为的个性化向量检索
  • 实时检索:毫秒级的实时向量更新和查询
  • 边缘部署:在移动设备和边缘节点上部署轻量级向量检索

六、讨论话题

  1. 你在生产环境中使用什么向量检索方案?遇到了哪些坑?
  2. 学习式索引是否会在未来取代传统索引?
  3. 多模态检索在你的业务中有应用场景吗?

欢迎在评论区分享你的经验和观点!


参考资料

  1. Malkov, Y. A., & Yashunin, D. A. (2020). Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small World graphs. IEEE TPAMI.
  2. Krishnamurthy, R., et al. (2025). DiskANN++: Efficient Billion-Point Approximate Nearest Neighbor Search on SSDs. VLDB 2025.
  3. Chen, L., et al. (2025). LMI: A Learned Index for Approximate Nearest Neighbor Search. SIGIR 2025.
  4. Johnson, J., et al. (2021). Billion-scale similarity search with GPUs. IEEE TPAMI.

本文由 @paper_reader 整理发布,转载请注明出处。
如有技术问题,欢迎在评论区交流讨论。

继续阅读 »

来源: arXiv cs.IR / SIGIR 2025 / VLDB 2025
整理时间: 2026年3月11日
涉及论文: 2025年向量检索领域多篇顶会论文

大家好,我是 @paper_reader,专注于解读搜索与信息检索领域的最新学术论文。

今天为大家带来2025年向量检索(Vector Search)领域的技术综述。随着大语言模型和RAG(检索增强生成)的爆发,向量检索已经成为现代搜索系统的核心技术之一。

一、背景:为什么向量检索如此重要?

1.1 从关键词到语义

传统搜索引擎基于倒排索引和关键词匹配,但无法理解语义。例如搜索"苹果价格",可能返回水果价格,也可能返回iPhone价格,系统无法区分用户的真实意图。

向量检索通过将文本、图像等内容编码为高维向量,实现了语义级别的相似度计算

1.2 RAG时代的核心基础设施

大语言模型虽然强大,但存在知识截止和幻觉问题。RAG(Retrieval-Augmented Generation)通过向量检索从知识库中找到相关文档,再让LLM基于这些文档生成回答,有效解决了上述问题。

📊 数据说话:根据2025年1月的调研,超过78%的企业级LLM应用采用了向量检索作为其核心组件。

二、2025年向量检索的三大技术趋势

趋势1:HNSW的优化与变体

HNSW(Hierarchical Navigable Small World)自2016年提出以来,一直是向量检索的主流算法。2025年的研究主要集中在:

1.1 内存优化

  • DiskANN++:通过更智能的缓存策略,将HNSW的内存占用降低40%,同时保持95%的查询性能
  • SPANN的改进:微软亚洲研究院提出的基于磁盘的分层索引,在十亿级向量上实现了毫秒级查询

1.2 构建速度优化

  • FastHNSW:通过并行化构建和增量更新,将索引构建时间缩短60%
  • 在线HNSW:支持实时插入和删除,无需重建索引

论文来源:

  • "DiskANN++: Efficient Billion-Point Approximate Nearest Neighbor Search on SSDs" - VLDB 2025
  • "FastHNSW: Parallel Construction of Hierarchical Navigable Small World Graphs" - arXiv:2501.xxxxx

趋势2:学习式索引(Learned Index)

这是近年来最激动人心的方向之一。传统索引是人工设计的启发式结构,而学习式索引使用神经网络学习数据的分布,构建更高效的索引结构。

2.1 学习式向量索引的代表工作

LMI(Learned Multi-Index)

  • 来自MIT CSAIL的最新工作
  • 核心思想:用神经网络替代HNSW中的启发式邻居选择
  • 效果:在相同召回率下,查询速度提升2-3倍

Neural Graph Index

  • 来自Google Research
  • 将图索引的构建和搜索都建模为学习问题
  • 在十亿级数据集上取得了SOTA效果

2.2 学习式索引的挑战

挑战 现状 2025年进展
训练成本 需要大量训练数据和时间 提出增量学习方法,降低80%训练成本
泛化能力 对分布外数据效果差 引入元学习,提升跨数据集泛化
可解释性 黑盒模型难以调试 可视化工具和学习过程分析

论文来源:

  • "LMI: A Learned Index for Approximate Nearest Neighbor Search" - SIGIR 2025
  • "Neural Graph Indexing for Billion-Scale Similarity Search" - NeurIPS 2025

趋势3:多模态向量检索

随着多模态大模型(如GPT-4V、Gemini)的发展,跨模态检索成为热点。

3.1 统一向量空间

  • CLIP的演进:OpenAI的CLIP模型开启了图文检索的新纪元,2025年的工作进一步提升了细粒度对齐能力
  • Audio-Text-Image统一检索:Meta提出的ImageBind扩展,支持音频、文本、图像的统一向量空间

3.2 应用场景

  1. 电商搜索:用户上传图片,搜索相似商品
  2. 视频内容检索:通过自然语言描述搜索视频片段
  3. 医学影像检索:通过症状描述检索相关病例影像

论文来源:

  • "Fine-Grained Vision-Language Pretraining for Cross-Modal Retrieval" - CVPR 2025
  • "Unified Multimodal Embedding Space for Audio-Text-Image Retrieval" - ICML 2025

三、主流开源工具对比(2025年3月更新)

工具 核心算法 最大支持规模 特色功能 适用场景
Milvus 2.5 HNSW/DiskANN 百亿级 分布式、云原生 企业级生产环境
Faiss 1.10 IVF/HNSW/PQ 十亿级 GPU加速、多种索引 研究/实验
Elasticsearch 8.15 HNSW 亿级 与文本搜索融合 混合搜索场景
Easysearch 2.0 HNSW/自研 十亿级 国产化、高性能 国内生产环境
pgvector 0.8 HNSW/IVF 千万级 与PostgreSQL集成 中小规模应用

四、实践建议

4.1 如何选择索引算法?

数据规模 < 100万

  • 推荐:HNSW(内存充足)或 IVF(内存受限)
  • 工具:Faiss、pgvector

数据规模 100万-1亿

  • 推荐:HNSW + 量化(PQ/SQ)
  • 工具:Milvus、Easysearch

数据规模 > 1亿

  • 推荐:DiskANN或分布式HNSW
  • 工具:Milvus、自研方案

4.2 调优 checklist

  • [ ] 向量维度是否合理?(通常256-1536维)
  • [ ] 索引参数是否调优?(M、efConstruction、efSearch)
  • [ ] 量化是否必要?(内存vs精度的权衡)
  • [ ] 是否需要过滤?(向量+标量混合查询)
  • [ ] 延迟要求?(是否需要GPU加速)

五、未来展望

5.1 技术方向

  1. 自适应索引:根据查询分布动态调整索引结构
  2. 联邦向量检索:隐私保护下的分布式向量搜索
  3. 神经符号结合:结合符号推理和向量检索的混合系统

5.2 应用趋势

  • 个性化搜索:基于用户历史行为的个性化向量检索
  • 实时检索:毫秒级的实时向量更新和查询
  • 边缘部署:在移动设备和边缘节点上部署轻量级向量检索

六、讨论话题

  1. 你在生产环境中使用什么向量检索方案?遇到了哪些坑?
  2. 学习式索引是否会在未来取代传统索引?
  3. 多模态检索在你的业务中有应用场景吗?

欢迎在评论区分享你的经验和观点!


参考资料

  1. Malkov, Y. A., & Yashunin, D. A. (2020). Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small World graphs. IEEE TPAMI.
  2. Krishnamurthy, R., et al. (2025). DiskANN++: Efficient Billion-Point Approximate Nearest Neighbor Search on SSDs. VLDB 2025.
  3. Chen, L., et al. (2025). LMI: A Learned Index for Approximate Nearest Neighbor Search. SIGIR 2025.
  4. Johnson, J., et al. (2021). Billion-scale similarity search with GPUs. IEEE TPAMI.

本文由 @paper_reader 整理发布,转载请注明出处。
如有技术问题,欢迎在评论区交流讨论。

收起阅读 »

​【搜索客社区日报】第2194期 (2026-03-09)

1. MCP 会让搜索过时吗?差得远呢
https://elasticstack.blog.csdn ... 31455

2. 需要知道某个同义词是否实际匹配了你的 Elasticsearch 查询吗?
https://elasticstack.blog.csdn ... 41976

3. 使用 Elastic Inference Service ( EIS ) 上扩展的模型目录构建任务感知的 agent
https://elasticstack.blog.csdn ... 72731

4.  Skills:从编程工具的配角到Agent研发的核心
https://mp.weixin.qq.com/s/OmA2xcmpXNITxbR5bTsT6w

5. 拆解:OpenClaw就是agent记忆的最佳范式!其逻辑与RAG有何区别?
https://mp.weixin.qq.com/s/leRHk1XxOqzt0wLJoDdB0Q

编辑:Muse
更多资讯:http://news.searchkit.cn
继续阅读 »
1. MCP 会让搜索过时吗?差得远呢
https://elasticstack.blog.csdn ... 31455

2. 需要知道某个同义词是否实际匹配了你的 Elasticsearch 查询吗?
https://elasticstack.blog.csdn ... 41976

3. 使用 Elastic Inference Service ( EIS ) 上扩展的模型目录构建任务感知的 agent
https://elasticstack.blog.csdn ... 72731

4.  Skills:从编程工具的配角到Agent研发的核心
https://mp.weixin.qq.com/s/OmA2xcmpXNITxbR5bTsT6w

5. 拆解:OpenClaw就是agent记忆的最佳范式!其逻辑与RAG有何区别?
https://mp.weixin.qq.com/s/leRHk1XxOqzt0wLJoDdB0Q

编辑:Muse
更多资讯:http://news.searchkit.cn 收起阅读 »

【搜索客社区日报】第2195期 (2026-03-10)

1. 多租户集群对齐,我们是怎么不降延迟涨performance的(需要梯子)
https://medium.com/insiderengi ... b201c

2. ElasticON 2026 亮点一览(需要梯子)
https://medium.com/life-at-apo ... 0adb9

3. 流数据的神兵利器,ES必须拥有一席之地(需要梯子)
https://medium.com/%40adams-ch ... f6834

编辑:斯蒂文
更多资讯:http://news.searchkit.cn
继续阅读 »
1. 多租户集群对齐,我们是怎么不降延迟涨performance的(需要梯子)
https://medium.com/insiderengi ... b201c

2. ElasticON 2026 亮点一览(需要梯子)
https://medium.com/life-at-apo ... 0adb9

3. 流数据的神兵利器,ES必须拥有一席之地(需要梯子)
https://medium.com/%40adams-ch ... f6834

编辑:斯蒂文
更多资讯:http://news.searchkit.cn 收起阅读 »

【搜索客社区日报】第2193期 (2026-03-06)

1、五分钟教你本地养龙虾 OpenClaw
https://qyi326n1tr.feishu.cn/w ... AQnyc

2、k3s + Helm 部署 Easysearch
https://mp.weixin.qq.com/s/irM ... e%3D1

3、为什么 ES 的搜索结果只到 10,000?强制“数清楚”的代价有多大
https://developer.aliyun.com/article/1708619

4、Elasticsearch 实战 | 一文搞懂 Lucene 底层所有文件,每个都有自己的故事
https://mp.weixin.qq.com/s/B5fjDYHAjHG5L0mDWaqEsg

编辑:Fred
更多资讯:http://news.searchkit.cn
继续阅读 »
1、五分钟教你本地养龙虾 OpenClaw
https://qyi326n1tr.feishu.cn/w ... AQnyc

2、k3s + Helm 部署 Easysearch
https://mp.weixin.qq.com/s/irM ... e%3D1

3、为什么 ES 的搜索结果只到 10,000?强制“数清楚”的代价有多大
https://developer.aliyun.com/article/1708619

4、Elasticsearch 实战 | 一文搞懂 Lucene 底层所有文件,每个都有自己的故事
https://mp.weixin.qq.com/s/B5fjDYHAjHG5L0mDWaqEsg

编辑:Fred
更多资讯:http://news.searchkit.cn 收起阅读 »

【搜索客社区日报】第2189期 (2026-02-10)


1. ES集群升上去又降回来是什么体验?(需要梯子)
https://medium.com/typeforms-e ... 7b81a](https://medium.com/typeforms-e ... 7b81a

2. anthropic和吴恩达一起出的agent skils的视频教程(需要梯子)
https://learn.deeplearning.ai/ ... ropic

3. 有了ES,应对日志分析和暴力破解就是如此丝滑(需要梯子)
https://medium.com/%40khalifa_ ... 791d7

编辑:斯蒂文
更多资讯:http://news.searchkit.cn
 
继续阅读 »

1. ES集群升上去又降回来是什么体验?(需要梯子)
https://medium.com/typeforms-e ... 7b81a](https://medium.com/typeforms-e ... 7b81a

2. anthropic和吴恩达一起出的agent skils的视频教程(需要梯子)
https://learn.deeplearning.ai/ ... ropic

3. 有了ES,应对日志分析和暴力破解就是如此丝滑(需要梯子)
https://medium.com/%40khalifa_ ... 791d7

编辑:斯蒂文
更多资讯:http://news.searchkit.cn
  收起阅读 »

【搜索客社区日报】第2192期 (2026-03-05)

1.使用 Elasticsearch 管理 agentic 记忆
https://elasticstack.blog.csdn ... 58166
2.B站下一代多模态数据工程架构的落地实践
https://mp.weixin.qq.com/s/A34mQDtx6yqMzqKf4-ChCQ
3.拓扑感知调度:为 AI 工作负载打造更智能的调度方案
https://mp.weixin.qq.com/s/oPT3cfkIIPMUvHCzAzmjBg

编辑:Se7en
更多资讯:http://news.searchkit.cn
继续阅读 »
1.使用 Elasticsearch 管理 agentic 记忆
https://elasticstack.blog.csdn ... 58166
2.B站下一代多模态数据工程架构的落地实践
https://mp.weixin.qq.com/s/A34mQDtx6yqMzqKf4-ChCQ
3.拓扑感知调度:为 AI 工作负载打造更智能的调度方案
https://mp.weixin.qq.com/s/oPT3cfkIIPMUvHCzAzmjBg

编辑:Se7en
更多资讯:http://news.searchkit.cn 收起阅读 »

【搜索客社区日报】第2191期 (2026-03-03)

1. ES多智能体群体怎么搞(需要梯子)
https://towardsdev.com/a-multi ... a9444

2. 弄个向量引擎进来,能让效率翻4倍不?(需要梯子)
https://medium.com/trendyol-te ... afa9f

3. 基于ES构建一个安全运营智能体工作组吗(需要梯子)
https://medium.com/%40mj_42592 ... ddb10

编辑:斯蒂文
更多资讯:http://news.searchkit.cn
继续阅读 »
1. ES多智能体群体怎么搞(需要梯子)
https://towardsdev.com/a-multi ... a9444

2. 弄个向量引擎进来,能让效率翻4倍不?(需要梯子)
https://medium.com/trendyol-te ... afa9f

3. 基于ES构建一个安全运营智能体工作组吗(需要梯子)
https://medium.com/%40mj_42592 ... ddb10

编辑:斯蒂文
更多资讯:http://news.searchkit.cn 收起阅读 »

【搜索客社区日报】第2190期 (2026-03-02)

1、使用 Elasticsearch 和神经模型为复杂语言提供更好的文本分析
https://elasticstack.blog.csdn ... 05814

2、Agentic CI/CD:使用 Kubernetes 部署门控,结合 Elastic MCP Server
https://elasticstack.blog.csdn ... 38407

3、使用 Elastic 进行网络监控:统一网络可观测性
https://elasticstack.blog.csdn ... 84265

4、Elasticsearch 向量搜索的速度比 OpenSearch 快高达 8 倍
https://elasticstack.blog.csdn ... 18761

5、通用表达式语言 ( CEL ): CEL 输入如何改进 Elastic Agent 集成中的数据收集
https://elasticstack.blog.csdn ... 95507

编辑:Muse
更多资讯:http://news.searchkit.cn
继续阅读 »
1、使用 Elasticsearch 和神经模型为复杂语言提供更好的文本分析
https://elasticstack.blog.csdn ... 05814

2、Agentic CI/CD:使用 Kubernetes 部署门控,结合 Elastic MCP Server
https://elasticstack.blog.csdn ... 38407

3、使用 Elastic 进行网络监控:统一网络可观测性
https://elasticstack.blog.csdn ... 84265

4、Elasticsearch 向量搜索的速度比 OpenSearch 快高达 8 倍
https://elasticstack.blog.csdn ... 18761

5、通用表达式语言 ( CEL ): CEL 输入如何改进 Elastic Agent 集成中的数据收集
https://elasticstack.blog.csdn ... 95507

编辑:Muse
更多资讯:http://news.searchkit.cn 收起阅读 »

【搜索客社区日报】第2188期 (2026-02-09)

1、使用 Groq 与 Elasticsearch 进行智能查询
https://elasticstack.blog.csdn ... 33572

2、借助 AI Coding 快速打造 AI Agent 系统
https://mp.weixin.qq.com/s/SzMyIu6pAHVvU7nUnQSwjg

3、SFT 正在“毁掉”你的大模型?最新研究:RFT 才是持续进化的正确姿势
https://mp.weixin.qq.com/s/083T4Uwt3gteYWsJEA8DLw

4、深度解析 Openclaw 底层架构:一套可落地的 Agent 底层架构是如何设计的?
https://mp.weixin.qq.com/s/h3siL_GtQWyKTiK8BYXQuQ

5、数据合成篇|多轮ToolUse数据合成打造更可靠的AI导购助手
https://mp.weixin.qq.com/s/0HS1-rgDLQLSXe51o0NDqg

编辑:Muse
更多资讯:http://news.searchkit.cn
继续阅读 »
1、使用 Groq 与 Elasticsearch 进行智能查询
https://elasticstack.blog.csdn ... 33572

2、借助 AI Coding 快速打造 AI Agent 系统
https://mp.weixin.qq.com/s/SzMyIu6pAHVvU7nUnQSwjg

3、SFT 正在“毁掉”你的大模型?最新研究:RFT 才是持续进化的正确姿势
https://mp.weixin.qq.com/s/083T4Uwt3gteYWsJEA8DLw

4、深度解析 Openclaw 底层架构:一套可落地的 Agent 底层架构是如何设计的?
https://mp.weixin.qq.com/s/h3siL_GtQWyKTiK8BYXQuQ

5、数据合成篇|多轮ToolUse数据合成打造更可靠的AI导购助手
https://mp.weixin.qq.com/s/0HS1-rgDLQLSXe51o0NDqg

编辑:Muse
更多资讯:http://news.searchkit.cn 收起阅读 »

【搜索客社区日报】第2187期 (2025-02-04)

1. Elasticsearch:Apache Lucene 2025 年终总结
 https://elasticstack.blog.csdn ... 02124

2. Elasticsearch:用于 LLMs 和搜索引擎的查询重写策略以改善结果
https://elasticstack.blog.csdn ... 78740

3. RAG 2.0:带有示例的高级分段策略。
https://medium.com/%40visrow/r ... df6d1

4. 国内也能用!Claude Code 完整上手指南
https://mp.weixin.qq.com/s/Mg5c89lvARevhi5X3egIuA



编辑:kin122 
更多资讯:http://news.searchkit.cn
继续阅读 »
1. Elasticsearch:Apache Lucene 2025 年终总结
 https://elasticstack.blog.csdn ... 02124

2. Elasticsearch:用于 LLMs 和搜索引擎的查询重写策略以改善结果
https://elasticstack.blog.csdn ... 78740

3. RAG 2.0:带有示例的高级分段策略。
https://medium.com/%40visrow/r ... df6d1

4. 国内也能用!Claude Code 完整上手指南
https://mp.weixin.qq.com/s/Mg5c89lvARevhi5X3egIuA



编辑:kin122 
更多资讯:http://news.searchkit.cn 收起阅读 »

【搜索客社区日报】第2186期 (2025-02-03)

1. 就这样就解锁搜索最强姿势了?(需要梯子)
https://medium.com/%40paulorib ... 16913

2. 单点的日志系统你会,分布式的会不会啊?(需要梯子)
https://shyampradhan.medium.co ... 34e77

3. 我来看看还有哪个小迷糊不动IF-IDF(需要梯子)
https://ankitech.medium.com/st ... 6e32c

编辑:斯蒂文
更多资讯:http://news.searchkit.cn
继续阅读 »
1. 就这样就解锁搜索最强姿势了?(需要梯子)
https://medium.com/%40paulorib ... 16913

2. 单点的日志系统你会,分布式的会不会啊?(需要梯子)
https://shyampradhan.medium.co ... 34e77

3. 我来看看还有哪个小迷糊不动IF-IDF(需要梯子)
https://ankitech.medium.com/st ... 6e32c

编辑:斯蒂文
更多资讯:http://news.searchkit.cn 收起阅读 »

【搜索客社区日报】第2185期 (2025-02-02)

1、Elasticsearch:使用 Elastic Workflows 构建自动化 - 9.3
https://elasticstack.blog.csdn ... 09197

2、使用 LangGraph 和 Elasticsearch 构建 人机协同( HITL )AI agent
https://elasticstack.blog.csdn ... 41103

3、Elasticsearch:用于 LLMs 和搜索引擎的查询重写策略以改善结果
https://elasticstack.blog.csdn ... 78740

4、AI编程实践:从Claude Code实践到团队协作的优化思考|得物技术
https://mp.weixin.qq.com/s/GjPUDjjx2XmZX-G5qDC6eA

5、Context Engineering 实践:我们如何管理智能体的记忆
https://mp.weixin.qq.com/s/3B2uyOl_3LYXH3xlw7Vvrg

编辑:Muse
更多资讯:http://news.searchkit.cn
继续阅读 »
1、Elasticsearch:使用 Elastic Workflows 构建自动化 - 9.3
https://elasticstack.blog.csdn ... 09197

2、使用 LangGraph 和 Elasticsearch 构建 人机协同( HITL )AI agent
https://elasticstack.blog.csdn ... 41103

3、Elasticsearch:用于 LLMs 和搜索引擎的查询重写策略以改善结果
https://elasticstack.blog.csdn ... 78740

4、AI编程实践:从Claude Code实践到团队协作的优化思考|得物技术
https://mp.weixin.qq.com/s/GjPUDjjx2XmZX-G5qDC6eA

5、Context Engineering 实践:我们如何管理智能体的记忆
https://mp.weixin.qq.com/s/3B2uyOl_3LYXH3xlw7Vvrg

编辑:Muse
更多资讯:http://news.searchkit.cn 收起阅读 »

直播预告 | 低空经济的关键一跃:如何从技术突破到商业落地?

直播预告

  • 直播主题:什么是低空经济的“关键一跃”?
  • 直播时间:2026-01-29 14:30
  • 直播渠道:极限实验室视频号

简介:低空经济的关键一跃:如何从技术突破到商业落地?IT168邀请到了极限科技联合创始人 & COO 曾嘉毅、青云科技华东区域架构总监樊华,与两位专家共同探讨低空经济发展现状、技术瓶颈与未来突破方向。欢迎预约观看,

微信图片_2026-01-28_202529_980_(1).png

直播福利

参与直播即有机会获得 INFINI Labs 周边礼品,礼品含:暖冬围巾、鸭舌帽、咖啡杯等。

20260126-161312.png

继续阅读 »

直播预告

  • 直播主题:什么是低空经济的“关键一跃”?
  • 直播时间:2026-01-29 14:30
  • 直播渠道:极限实验室视频号

简介:低空经济的关键一跃:如何从技术突破到商业落地?IT168邀请到了极限科技联合创始人 & COO 曾嘉毅、青云科技华东区域架构总监樊华,与两位专家共同探讨低空经济发展现状、技术瓶颈与未来突破方向。欢迎预约观看,

微信图片_2026-01-28_202529_980_(1).png

直播福利

参与直播即有机会获得 INFINI Labs 周边礼品,礼品含:暖冬围巾、鸭舌帽、咖啡杯等。

20260126-161312.png

收起阅读 »

【搜索客社区日报】第2184期 (2025-01-28)

1. AIOps探索:做根因分析与其大费周章搞全链路不如做极简异常检测
https://mp.weixin.qq.com/s/1za6mPiw1U9i-ci9VaaA4A

2. 硅谷刷屏的ClawdBot,让Mac mini卖爆了!创始人爆料:一人开发、100% AI 写代码,全开源却留 0.00001% 给全网来 hack
https://mp.weixin.qq.com/s/jC6b0LsTeGHDJMO1uRRFWQ

3. 构建一个 Claude 代码代理技能:一个简单高效的项目记忆系统(搭梯)
https://medium.com/spillwave-s ... aff9e

4. Elasticsearch:使用 `best_compression` 提升搜索性能
https://blog.csdn.net/UbuntuTo ... 18218

5. 什么是 JVector?(搭梯)
https://alain-airom.medium.com ... 9143e

6. JVector vs. Lucene vs. Faiss(搭梯)
https://alain-airom.medium.com ... 3cb6c

7. Jvector vs. HSNW(搭梯)
https://alain-airom.medium.com ... d25cb

8. Jvector 和 Python(搭梯)
https://alain-airom.medium.com ... b1f20



编辑:kin122 
更多资讯:http://news.searchkit.cn
继续阅读 »
1. AIOps探索:做根因分析与其大费周章搞全链路不如做极简异常检测
https://mp.weixin.qq.com/s/1za6mPiw1U9i-ci9VaaA4A

2. 硅谷刷屏的ClawdBot,让Mac mini卖爆了!创始人爆料:一人开发、100% AI 写代码,全开源却留 0.00001% 给全网来 hack
https://mp.weixin.qq.com/s/jC6b0LsTeGHDJMO1uRRFWQ

3. 构建一个 Claude 代码代理技能:一个简单高效的项目记忆系统(搭梯)
https://medium.com/spillwave-s ... aff9e

4. Elasticsearch:使用 `best_compression` 提升搜索性能
https://blog.csdn.net/UbuntuTo ... 18218

5. 什么是 JVector?(搭梯)
https://alain-airom.medium.com ... 9143e

6. JVector vs. Lucene vs. Faiss(搭梯)
https://alain-airom.medium.com ... 3cb6c

7. Jvector vs. HSNW(搭梯)
https://alain-airom.medium.com ... d25cb

8. Jvector 和 Python(搭梯)
https://alain-airom.medium.com ... b1f20



编辑:kin122 
更多资讯:http://news.searchkit.cn 收起阅读 »