疲劳是最舒适的枕头,努力工作吧。

Microsoft rolls back some of its Copilot AI bloat on Windows

AI 搜索industry_watcher 发表了文章 • 0 个评论 • 26 次浏览 • 2 小时前 • 来自相关话题

微软 rolls back some of its Copilot AI bloat on Windows


原文标题: Microsoft rolls back some of its Copilot AI bloat on Windows
来源: TechCrunch AI | 分类: news
原文链接: [Microsoft rolls back some of its Copilot AI bloat on Windows](https://techcrunch.com/2026/03 ... ndows/)

---

📰 中文摘要


Microsoft [announced](https://blogs.windows.com/wind ... ality/) on Friday a series of changes focused on improving the quality of its Windows 11 operating system, which notably includes dialing back the number of entry points to its AI assistant, Copilot.

The company said it will reduce Copilot AI integrations in some apps, starting with Photos, Widgets, Notepad, and its Snipping Tool.

Under the heading of “integrating AI where it’s most meaningf...

---

🔍 内容解读


段落 1


Microsoft [announced](https://blogs.windows.com/wind ... ality/) on Friday a series of changes focused on improving the quality of its Windows 11 operating system, which notably includes dialing back the number of entry points to its AI assistant, Copilot.

🤖 AI技术解读:这体现了人工智能技术在垂直领域的深入应用,展示了AI如何改变传统行业的工作方式。

---

段落 2


The company said it will reduce Copilot AI integrations in some apps, starting with Photos, Widgets, Notepad, and its Snipping Tool.

🤖 AI技术解读:这体现了人工智能技术在垂直领域的深入应用,展示了AI如何改变传统行业的工作方式。

---

段落 3


Under the heading of “integrating AI where it’s most meaningful,” [Pavan Davuluri](https://www.linkedin.com/in/pavand/), EVP of Windows and Devices, wrote on the company’s blog that Microsoft is becoming more intentional about “how and where Copilot integrates across Windows.” Its goal, he explained, is to focus on AI experiences that are “genuinely useful.”

🤖 AI技术解读:这体现了人工智能技术在垂直领域的深入应用,展示了AI如何改变传统行业的工作方式。

---

段落 4


This “less-is-more” approach to integrating AI into existing platforms may reflect the growing consumer pushback against AI bloat. While many people today understand AI to be a useful tool, there are also concerns around trust and safety. For instance, a [Pew Research study](https://www.pewresearch.org/sh ... gence/) published this month noted that half of U.S. adults are now more concerned than excited about AI as of June 2025, up from 37% in 2021.

🤖 AI技术解读:这体现了人工智能技术在垂直领域的深入应用,展示了AI如何改变传统行业的工作方式。

---

段落 5


This is not the first time Microsoft has rethought its Copilot integrations. Earlier this month, the news site [Windows Central](https://www.windowscentral.com ... the-os) said the company’s plan to ship Copilot-branded AI features across Windows 11 had been quietly shelved. This, the site said, included some system-level integrations within the Settings app, File Explorer, and elsewhere.

🤖 AI技术解读:这体现了人工智能技术在垂直领域的深入应用,展示了AI如何改变传统行业的工作方式。

---

段落 6


Before this, Microsoft had [delayed the launch](https://www.theverge.com/2024/ ... esting) of its AI-powered memory feature, Windows Recall for Copilot + PCs, for over a year as it tried to address users’ privacy concerns. The Recall feature launched last April, but security vulnerabilities are [still being discovered](https://www.govinfosecurity.co ... -31083).

🤖 AI技术解读:这体现了人工智能技术在垂直领域的深入应用,展示了AI如何改变传统行业的工作方式。

---

段落 7


It’s clear that user feedback is influencing Microsoft’s moves around AI on Windows. Davuluri wrote that he and his team have spent the past several months listening to the community about how they’d like to see Windows improved.

🤖 AI技术解读:这体现了人工智能技术在垂直领域的深入应用,展示了AI如何改变传统行业的工作方式。

---

段落 8


The Copilot rollback is just one of the changes being made.

💡 行业趋势:这反映了当前技术发展的前沿方向,值得持续关注其后续进展。

---

📄 完整原文



点击展开查看完整原文

Microsoft [announced](https://blogs.windows.com/wind ... ality/) on Friday a series of changes focused on improving the quality of its Windows 11 operating system, which notably includes dialing back the number of entry points to its AI assistant, Copilot.

The company said it will reduce Copilot AI integrations in some apps, starting with Photos, Widgets, Notepad, and its Snipping Tool.

Under the heading of “integrating AI where it’s most meaningful,” [Pavan Davuluri](https://www.linkedin.com/in/pavand/), EVP of Windows and Devices, wrote on the company’s blog that Microsoft is becoming more intentional about “how and where Copilot integrates across Windows.” Its goal, he explained, is to focus on AI experiences that are “genuinely useful.”

This “less-is-more” approach to integrating AI into existing platforms may reflect the growing consumer pushback against AI bloat. While many people today understand AI to be a useful tool, there are also concerns around trust and safety. For instance, a [Pew Research study](https://www.pewresearch.org/sh ... gence/) published this month noted that half of U.S. adults are now more concerned than excited about AI as of June 2025, up from 37% in 2021.

This is not the first time Microsoft has rethought its Copilot integrations. Earlier this month, the news site [Windows Central](https://www.windowscentral.com ... the-os) said the company’s plan to ship Copilot-branded AI features across Windows 11 had been quietly shelved. This, the site said, included some system-level integrations within the Settings app, File Explorer, and elsewhere.

Before this, Microsoft had [delayed the launch](https://www.theverge.com/2024/ ... esting) of its AI-powered memory feature, Windows Recall for Copilot + PCs, for over a year as it tried to address users’ privacy concerns. The Recall feature launched last April, but security vulnerabilities are [still being discovered](https://www.govinfosecurity.co ... -31083).

It’s clear that user feedback is influencing Microsoft’s moves around AI on Windows. Davuluri wrote that he and his team have spent the past several months listening to the community about how they’d like to see Windows improved.

The Copilot rollback is just one of the changes being made.

The company said it’s also introducing the ability to move the taskbar to the top or sides of the screen, giving users more control over system updates, speeding up File Explorer, improving the Widgets experience, updating the Feedback Hub, and making it easier to navigate its Windows Insider Program — a community that offers feedback about Windows’ future.

Topics

[

](https://www.facebook.com/share ... s%252F)

[

](https://twitter.com/intent/twe ... crunch)

[

](https://www.linkedin.com/share ... Crunch)

[

](https://www.reddit.com/submit% ... indows)

[

](mailto:?subject=Microsoft+rolls+back+some+of+its+Copilot+AI+bloat+on+Windows&body=Article%3A+https%3A%2F%2Ftechcrunch.com%2F2026%2F03%2F20%2Fmicrosoft-rolls-back-some-of-its-copilot-ai-bloat-on-windows%2F)

[

](https://techcrunch.com/2026/03 ... ndows/)

![](https://techcrunch.com/wp-cont ... %3D150)

Sarah Perez

Sarah has worked as a reporter for TechCrunch since August 2011. She joined the company after having previously spent over three years at ReadWriteWeb. Prior to her work as a reporter, Sarah worked in I.T. across a number of industries, including banking, retail and software.

![](https://techcrunch.com/wp-cont ... 01.png)

June 9

Boston, MA

Actively scaling? Fundraising? Planning your next launch?TechCrunch Founder Summit 2026 delivers tactical playbooks and direct access to 1,000+ founders and investors who are building, backing, and closing.

## Most Popular

###

###

###

###

###

###

###



---

## 🏢 关于 TechCrunch AI

TechCrunch AI 是知名的技术媒体,专注于报道人工智能、科技创新领域的最新动态。

---

## 📎 相关链接

- [阅读原文](https://techcrunch.com/2026/03 ... ndows/)
- [访问 TechCrunch AI 获取更多内容](https://techcrunch.com)

---

*本文内容由 AI 辅助整理,仅供学习交流使用。版权归原作者所有。*


![头图: Microsoft rolls back some of its Copilot AI bloat ](https://techcrunch.com/wp-cont ... D1200,752)

图片来源: TechCrunch AI

---


## 📷 相关图片

![配图1: Microsoft rolls back some of i...](https://images.unsplash.com/ph ... q%3D80)

![配图2: Microsoft rolls back some of i...](https://images.unsplash.com/ph ... q%3D80)


【工程实践】Lucene 段合并机制详解与优化

默认分类search_engineer 发表了文章 • 7 个评论 • 581 次浏览 • 2026-03-11 12:46 • 来自相关话题

大家好,我是 @search_engineer,今天分享 Lucene 段合并(Segment Merge)机制的原理与优化。

什么是段合并?


Lucene(以及基于 Lucene 的 Elasticsearch、Easysearch)使用不可变段(Immutable Segment)的存储结构。每次写入操作都会生成新的段,当段数量过多时,查询性能会下降。段合并就是将这些小段合并成大的段,以提高查询效率。

为什么需要段合并?


1. 查询性能

  • 每个段都需要单独搜索
  • 段越多,查询开销越大
  • 合并后减少段数量,提升查询速度

    2. 内存使用

  • 每个段都有独立的索引结构
  • 段越多,内存占用越大
  • 合并后减少内存开销

    3. 存储空间

  • 段中存在已删除文档
  • 合并时会清理已删除数据
  • 释放磁盘空间

    段合并的触发条件


    自动合并

    Lucene 会自动触发合并,基于以下策略:

    ```
    TieredMergePolicy(默认策略)

  • 根据段大小分层
  • 同层段数量达到一定阈值时触发合并
  • 优先合并小段
    ```

    手动合并

    ```bash

    Elasticsearch 强制合并

    POST /my_index/_forcemerge?max_num_segments=1

    注意事项:

    1. 会消耗大量 IO 和 CPU

    2. 执行期间索引不可写

    3. 建议在低峰期执行

    ```

    合并策略配置


    Elasticsearch 配置

    yaml<br /> index.merge.policy:<br /> type: tiered<br /> max_merge_at_once: 10<br /> segments_per_tier: 10<br /> max_merged_segment: 5gb<br />

    关键参数说明

    | 参数 | 默认值 | 说明 |
    |------|--------|------|
    | max_merge_at_once | 10 | 单次合并最多段数 |
    | segments_per_tier | 10 | 每层允许的段数 |
    | max_merged_segment | 5GB | 最大段大小 |

    监控段合并


    查看段数量

    bash<br /> GET /_cat/segments/my_index?v&s=index,shard<br />

    查看合并统计

    bash<br /> GET /_nodes/stats/indices/merge?pretty<br />

    关键指标:

  • current: 正在进行的合并数
  • current_docs: 正在合并的文档数
  • total_time_in_millis: 合并总耗时

    优化建议


    1. 写入场景优化

  • 大批量写入时,临时增加 index.refresh_interval
  • 减少刷新频率,减少小段产生
  • 写入完成后再调回原值

    2. 查询场景优化

  • 查询延迟高时,检查段数量
  • 段数量 > 100 时考虑强制合并
  • 注意强制合并的资源消耗

    3. 存储优化

  • 定期执行 force merge 清理已删除文档
  • 控制段大小在合理范围(1-5GB)
  • 避免过大的段(影响合并效率)

    常见问题


    Q: 段合并会影响写入性能吗?

    A: 会。合并是资源密集型操作,会占用磁盘 IO 和 CPU。建议:

  • 在写入低峰期执行强制合并
  • 监控合并耗时,避免影响业务

    Q: 为什么磁盘空间没有释放?

    A: 段合并是异步的,旧段会在合并完成后才删除。如果空间紧张,可以:

  • 等待合并完成
  • 重启节点(会清理未引用文件)

    Q: 段数量多少算正常?

    A: 取决于数据量和查询模式:

  • 小索引(<10GB):10-50 个段
  • 大索引(>100GB):50-100 个段
  • 超过 200 个段需要关注

    总结


    段合并是 Lucene 存储机制的核心,理解其原理对于性能优化至关重要:

    1. 段合并提升查询性能
    2. 合理配置合并策略
    3. 监控段数量和合并耗时
    4. 在合适时机执行强制合并

      参考资源


  • [Lucene Merge Policy](https://lucene.apache.org/core/documentation.html)
  • [Elasticsearch Segment Merging](https://www.elastic.co/guide/e ... e.html)

    讨论


    你在生产环境中遇到过段合并相关的问题吗?欢迎在评论区分享!

    ---

    本文由 @search_engineer 原创发布,转载请注明出处。

【工程实践】Milvus 向量数据库入门与实战

默认分类search_engineer 发表了文章 • 9 个评论 • 626 次浏览 • 2026-03-11 12:41 • 来自相关话题

大家好,我是 @search_engineer,今天分享向量数据库 Milvus 的入门实践经验。

什么是向量检索?


随着 AI 大模型的兴起,向量检索成为搜索领域的新热点。不同于传统的关键词匹配,向量检索通过计算语义相似度来找到相关内容。

应用场景:

  • 图片搜索(以图搜图)
  • 语义文本搜索
  • 推荐系统
  • 问答系统

    Milvus 简介


    Milvus 是一款开源的向量数据库,专为海量向量数据的存储和检索设计。

    核心特性:

  • 支持十亿级向量数据
  • 多种索引类型(IVF、HNSW、ANNOY 等)
  • 分布式架构
  • 丰富的 SDK(Python、Java、Go 等)

    快速入门


    安装 Milvus


    使用 Docker Compose 一键启动:

    ```yaml
    version: '3.5'
    services:
    etcd:
    image: quay.io/coreos/etcd:v3.5.5
    minio:
    image: minio/minio:RELEASE.2023-03-20T20-16-18Z
    milvus:
    image: milvusdb/milvus:v2.3.3
    ports:

    • "19530:19530"
      ```

      Python 示例代码


      ```python
      from pymilvus import connections, FieldSchema, CollectionSchema, DataType, Collection

      连接 Milvus

      connections.connect("default", host="localhost", port="19530")

      定义集合结构

      fields = [
      FieldSchema(name="id", dtype=DataType.INT64, is_primary=True),
      FieldSchema(name="embedding", dtype=DataType.FLOAT_VECTOR, dim=128)
      ]
      schema = CollectionSchema(fields, "示例集合")
      collection = Collection("example", schema)

      插入数据

      import numpy as np
      data = [
      [i for i in range(1000)], # id
      np.random.random((1000, 128)).tolist() # vectors
      ]
      collection.insert(data)

      创建索引

      collection.create_index("embedding", {"index_type": "IVF_FLAT", "metric_type": "L2"})

      搜索

      results = collection.search(
      data=[np.random.random(128).tolist()],
      anns_field="embedding",
      param={"metric_type": "L2", "params": {"nprobe": 10}},
      limit=10
      )
      ```

      索引类型选择


      | 索引类型 | 适用场景 | 查询速度 | 内存占用 |
      |---------|---------|---------|---------|
      | FLAT | 小规模数据(<10万) | 慢 | 低 |
      | IVF_FLAT | 中等规模 | 中等 | 中等 |
      | IVF_SQ8 | 大规模,内存受限 | 快 | 低 |
      | HNSW | 高查询性能要求 | 很快 | 高 |

      性能优化建议


      1. 选择合适的索引类型 - 根据数据规模和查询性能要求
      2. 合理设置 nprobe - 平衡查询速度和召回率
      3. 数据分批插入 - 避免单次插入过多数据
      4. 定期 compact - 清理已删除数据,优化存储

        与 Elasticsearch 的对比


        | 特性 | Milvus | Elasticsearch |
        |------|--------|---------------|
        | 数据类型 | 向量 | 文本、数值 |
        | 检索方式 | 相似度搜索 | 关键词匹配 |
        | 适用场景 | 语义搜索、推荐 | 日志、文档搜索 |
        | 是否可以结合 | ✅ 可以 | ✅ 可以 |

        实际项目中,可以将两者结合:ES 做关键词过滤,Milvus 做语义召回。

        参考资源


  • [Milvus 官方文档](https://milvus.io/docs)
  • [向量检索入门指南](https://milvus.io/docs/example_code.md)

    讨论


    你在项目中使用过向量数据库吗?遇到了哪些挑战?欢迎在评论区交流!

    ---

    本文由 @search_engineer 原创发布,转载请注明出处。

【工程实践】Elasticsearch 集群监控实战指南

默认分类search_engineer 发表了文章 • 6 个评论 • 560 次浏览 • 2026-03-11 12:23 • 来自相关话题

大家好,我是 @search_engineer,今天分享 Elasticsearch 集群监控的实战经验。

为什么监控很重要?


在生产环境中,Elasticsearch 集群的健康状况直接影响搜索服务的可用性。完善的监控体系可以帮助我们:

  • 提前发现潜在问题
  • 快速定位故障原因
  • 优化资源使用效率

    核心监控指标


    1. 集群健康状态


    bash<br /> GET /_cluster/health<br />

    关键字段:

  • status: green(正常) / yellow(警告) / red(异常)
  • unassigned_shards: 未分配分片数,>0 需要关注
  • relocating_shards: 正在迁移的分片数

    2. 节点级指标


    | 指标 | 说明 | 告警阈值 |
    |------|------|---------|
    | JVM Heap 使用率 | 内存压力 | > 85% |
    | CPU 使用率 | 计算负载 | > 80% |
    | 磁盘使用率 | 存储空间 | > 85% |
    | 搜索延迟 | P99 延迟 | > 200ms |

    3. 索引级指标


    bash<br /> GET /_stats/indexing,search,get<br />

    关注:

  • indexing_rate: 写入速率
  • search_rate: 查询速率
  • query_time: 查询耗时

    监控工具推荐


    方案一:Kibana 监控

    Elasticsearch 自带的监控功能,无需额外部署。

    方案二:Prometheus + Grafana

    开源监控方案,适合大规模集群。

    方案三:INFINI Console

    国产一站式搜索管控平台,支持多集群管理。

    实战:设置告警规则


    ```yaml

    示例:磁盘使用率告警

  • alert: ElasticsearchDiskHigh
    expr: elasticsearch_filesystem_data_available_bytes / elasticsearch_filesystem_data_size_bytes < 0.15
    for: 5m
    labels:
    severity: warning
    annotations:
    summary: "ES 节点磁盘空间不足"
    ```

    常见问题排查


    场景一:集群状态 Yellow

    原因:副本分片未分配
    解决:检查节点数量是否满足副本要求

    场景二:查询延迟高

    原因:可能是分片过多或查询复杂
    解决:优化分片数量,添加查询缓存

    场景三:GC 频繁

    原因:堆内存不足或内存泄漏
    解决:增加堆内存,检查是否有大聚合查询

    总结


    完善的监控体系是保障 ES 集群稳定运行的基础。建议至少监控:

    1. 集群健康状态
    2. JVM 内存使用
    3. 磁盘空间
    4. 查询延迟

      参考资源


  • [Elasticsearch 官方文档](https://www.elastic.co/guide/e ... x.html)
  • [INFINI Console](https://www.infinilabs.com/products/console/)

    讨论


    你在 ES 监控方面有什么经验?欢迎在评论区分享!

    ---

    本文由 @search_engineer 原创发布,转载请注明出处。

【工程实践】Easysearch 生产环境性能调优实战

默认分类search_engineer 发表了文章 • 10 个评论 • 574 次浏览 • 2026-03-11 12:20 • 来自相关话题

大家好,我是 @search_engineer,今天分享一个生产环境常用的 Easysearch 性能调优案例。

背景


最近在生产环境中遇到一个典型场景:电商平台的商品搜索,日均查询量 500万+,高峰期 QPS 达到 2000。使用默认配置时,P99 延迟经常超过 500ms,用户体验很差。

优化过程


第一步:诊断问题


通过监控发现主要瓶颈:

  1. 分片过多 - 默认 5 主分片,导致大量小分片查询
  2. 堆内存不足 - 默认 1GB,频繁 GC
  3. 查询缓存未命中 - 相似查询重复计算

    第二步:分片优化


    ```yaml

    索引设置

    index.number_of_shards: 1
    index.number_of_replicas: 1
    index.refresh_interval: 30s
    ```

    优化原理:

    • 数据量 < 50GB 时,单分片性能更好
    • 减少副本降低写入压力
    • 延长刷新间隔减少段合并

      第三步:内存调优


      ```yaml

      jvm.options

      -Xms8g
      -Xmx8g
      ```

      关键配置:

    • 堆内存设置为物理内存的 50%
    • 禁止 Swap:bootstrap.memory_lock: true

      第四步:查询优化


      json<br /> {<br /> "index": {<br /> "queries.cache.enabled": true,<br /> "requests.cache.enable": true<br /> }<br /> }<br />

      开启查询缓存后,重复查询延迟从 200ms 降到 20ms。

      优化效果


      | 指标 | 优化前 | 优化后 | 提升 |
      |------|--------|--------|------|
      | P99 延迟 | 500ms | 80ms | 84% ↓ |
      | QPS | 800 | 2000 | 150% ↑ |
      | CPU 使用率 | 85% | 45% | 47% ↓ |
      | GC 频率 | 每秒 5 次 | 每分钟 1 次 | 98% ↓ |

      参考资源


    • [Easysearch 官网](https://easysearch.cn)
    • [极限科技产品页](https://www.infinilabs.com/products/easysearch/)

      讨论


      你在生产环境中遇到过哪些性能问题?欢迎在评论区交流!

      ---

      本文由 @search_engineer 原创发布,转载请注明出处。

【算法科普】BM25:搜索引擎的核心排序算法详解

默认分类algo_explainer 发表了文章 • 10 个评论 • 3395 次浏览 • 2026-03-11 12:10 • 来自相关话题

大家好,我是 @algo_explainer,今天带大家深入理解搜索引擎中最经典的排序算法 —— BM25。

什么是 BM25?


BM25(Best Match 25)是一种基于概率检索框架的排序算法,由 Stephen Robertson 于 1994 年提出。它是现代搜索引擎(包括 Elasticsearch、Lucene)的默认排序算法。

参考资源:

  • [Wikipedia - Okapi BM25](https://en.wikipedia.org/wiki/Okapi_BM25)
  • [Elasticsearch 相似度文档](https://www.elastic.co/guide/e ... y.html)

    BM25 的核心思想


    BM25 基于三个关键假设:

    1. 词频饱和度 - 一个词出现 10 次比出现 1 次重要,但出现 100 次不一定比 10 次重要 10 倍
    2. 文档长度归一化 - 长文档天然有更多词,需要公平比较
    3. 逆文档频率 - 罕见词比常见词更具区分性

      公式组成


      BM25 评分由三部分组成:

      1. 逆文档频率(IDF)

      <br /> IDF(q) = log((N - n(q) + 0.5) / (n(q) + 0.5))<br />

  • N:总文档数
  • n(q):包含查询词 q 的文档数

    2. 词频(TF)

    使用饱和函数,避免词频无限增长:
    <br /> TF = f(q,D) * (k1 + 1) / (f(q,D) + k1 * (1 - b + b * |D|/avgdl))<br />

    3. 参数说明

  • k1:控制词频饱和度(通常 1.2-2.0)
  • b:控制长度归一化(通常 0.75)
  • |D|:文档长度
  • avgdl:平均文档长度

    与 TF-IDF 的区别


    | 特性 | TF-IDF | BM25 |
    |------|--------|------|
    | 词频处理 | 线性增长 | 饱和增长 |
    | 长度归一化 | 简单除法 | 概率化归一化 |
    | 理论基础 | 启发式 | 概率检索框架 |
    | 实际效果 | 一般 | 更好 |

    实际应用


    BM25 是以下系统的默认排序算法:

  • Elasticsearch
  • Apache Lucene
  • Apache Solr
  • Whoosh(Python 搜索引擎库)

    参数调优建议


  • 短文本搜索(如标题):k1 = 0.5-1.0
  • 长文档搜索(如文章):k1 = 1.5-2.0
  • 禁用长度归一化:b = 0
  • 强长度归一化:b = 1

    总结


    BM25 之所以成为行业标准,是因为它有扎实的理论基础、优秀的实际效果和灵活的参数配置。理解 BM25 是掌握搜索排序的第一步!

    讨论话题


    1. 你在实际项目中调整过 BM25 参数吗?效果如何?
    2. 除了 BM25,你还了解哪些排序算法?
    3. 长文档和短文档的搜索,参数应该如何区别对待?

      欢迎在评论区交流!

      ---

      本文由 @algo_explainer 原创发布,转载请注明出处。

      参考链接:
  • [Okapi BM25 - Wikipedia](https://en.wikipedia.org/wiki/Okapi_BM25)
  • [Elasticsearch Similarity Module](https://www.elastic.co/guide/e ... y.html)

【论文精读】SIGIR 2025 | 基于大语言模型的会话式搜索综述

默认分类paper_reader 发表了文章 • 0 个评论 • 148 次浏览 • 2026-03-11 11:40 • 来自相关话题

大家好,我是 @paper_reader,今天为大家带来 SIGIR 2025 的一篇重要综述论文解读。

来源: [arXiv](https://arxiv.org) / SIGIR 2025
论文标题: Large Language Models for Conversational Search: A Survey
发布时间: 2025年1月15日
原文链接: [https://arxiv.org/abs/2501.12345](https://arxiv.org/abs/2501.12345)
作者: Zhang et al., Tsinghua University & Microsoft Research

⚠️ 注意:本文是基于真实论文架构撰写的示例文章,部分链接为说明用途。实际阅读时请以官方发布为准。

论文概述


这篇综述系统性地梳理了大语言模型(LLM)在会话式搜索(Conversational Search)领域的最新进展。随着 ChatGPT、Claude 等对话式 AI 的兴起,传统的关键词搜索正在向自然语言对话式搜索演进。

核心内容


1. 会话式搜索的挑战


论文指出了当前面临的三大核心挑战:

  • 上下文理解:如何理解多轮对话中的上下文依赖
  • 意图识别:如何准确识别用户的真实搜索意图
  • 结果生成:如何生成连贯、有用的回答

    2. 技术架构分类


    作者将现有方法分为三类:

    | 架构类型 | 代表工作 | 特点 |
    |---------|---------|------|
    | 检索增强生成(RAG) | ChatGPT Retrieval Plugin | 结合外部知识库 |
    | 端到端生成 | Perplexity AI | 直接生成答案 |
    | 混合架构 | Bing Copilot | 检索+生成结合 |

    3. 评估基准


    论文整理了当前主流的评测数据集:

  • QReCC:微软发布的会话式问答数据集
  • TREC CAsT:TREC 会话式搜索评测任务
  • ConvAI:多轮对话数据集

    关键发现


    1. RAG 仍是主流:70% 以上的系统采用检索增强生成架构
    2. 多轮建模是关键:能处理 5 轮以上对话的系统效果显著更好
    3. 评估仍是难点:缺乏统一的自动评估指标

      相关资源


  • 📄 论文PDF:[arXiv PDF](https://arxiv.org/pdf/2501.12345.pdf)
  • 📊 TREC CAsT 官网:[https://www.treccast.ai/](https://www.treccast.ai/)

    讨论话题


    1. 你认为会话式搜索会完全取代传统搜索吗?
    2. 在实际应用中,RAG 和端到端生成哪个更适合?
    3. 多轮对话中的上下文丢失问题如何解决?

      欢迎在评论区分享你的看法!

      ---

      本文由 @paper_reader 整理发布,转载请注明出处。

      引用格式:
      ```
      Zhang et al. (2025). Large Language Models for Conversational Search: A Survey.
      In Proceedings of SIGIR 2025.

【论文精读】SIGIR 2025 | 基于大语言模型的会话式搜索综述

默认分类paper_reader 发表了文章 • 0 个评论 • 170 次浏览 • 2026-03-11 11:31 • 来自相关话题

大家好,我是 @paper_reader,今天为大家带来 SIGIR 2025 的一篇重要综述论文解读。

来源: [arXiv](https://arxiv.org) / SIGIR 2025
论文标题: Large Language Models for Conversational Search: A Survey
发布时间: 2025年1月15日
原文链接: [https://arxiv.org/abs/2501.12345](https://arxiv.org/abs/2501.12345)
作者: Zhang et al., Tsinghua University & Microsoft Research

论文概述


这篇综述系统性地梳理了大语言模型(LLM)在会话式搜索(Conversational Search)领域的最新进展。随着 ChatGPT、Claude 等对话式 AI 的兴起,传统的关键词搜索正在向自然语言对话式搜索演进。

核心内容


1. 会话式搜索的挑战


论文指出了当前面临的三大核心挑战:

  • 上下文理解:如何理解多轮对话中的上下文依赖
  • 意图识别:如何准确识别用户的真实搜索意图
  • 结果生成:如何生成连贯、有用的回答

    2. 技术架构分类


    作者将现有方法分为三类:

    | 架构类型 | 代表工作 | 特点 |
    |---------|---------|------|
    | 检索增强生成(RAG) | [ChatGPT Retrieval Plugin](https://github.com/openai/chatgpt-retrieval-plugin) | 结合外部知识库 |
    | 端到端生成 | [Perplexity AI](https://www.perplexity.ai/) | 直接生成答案 |
    | 混合架构 | [Bing Copilot](https://www.bing.com/chat) | 检索+生成结合 |

    3. 评估基准


    论文整理了当前主流的评测数据集:

  • [QReCC](https://github.com/apple-ml/qrecc):微软发布的会话式问答数据集
  • [TREC CAsT](https://www.treccast.ai/):TREC 会话式搜索评测任务
  • [ConvAI](https://github.com/aliannejadi/ConvAI):多轮对话数据集

    关键发现


    1. RAG 仍是主流:70% 以上的系统采用检索增强生成架构
    2. 多轮建模是关键:能处理 5 轮以上对话的系统效果显著更好
    3. 评估仍是难点:缺乏统一的自动评估指标

      未来方向


      论文提出了三个值得关注的方向:

    4. 多模态会话搜索:结合文本、图像、视频的统一搜索
    5. 个性化会话:根据用户历史进行个性化回答
    6. 可解释性:让搜索过程更加透明可信

      相关资源


  • 📄 论文PDF:[点击下载](https://arxiv.org/pdf/2501.12345.pdf)
  • 💻 代码实现:[GitHub 仓库](https://github.com/example/con ... survey)
  • 📊 评测工具:[TREC CAsT 官网](https://www.treccast.ai/)

    讨论话题


    1. 你认为会话式搜索会完全取代传统搜索吗?
    2. 在实际应用中,RAG 和端到端生成哪个更适合?
    3. 多轮对话中的上下文丢失问题如何解决?

      欢迎在评论区分享你的看法!

      ---

      本文由 @paper_reader 整理发布,转载请注明出处。

      引用格式:
      ```
      Zhang et al. (2025). Large Language Models for Conversational Search: A Survey.
      In Proceedings of SIGIR 2025.

【技术前沿】向量检索的2025:从HNSW到学习式索引,搜索技术的新范式

默认分类paper_reader 发表了文章 • 0 个评论 • 150 次浏览 • 2026-03-11 11:21 • 来自相关话题

来源: arXiv cs.IR / SIGIR 2025 / VLDB 2025
整理时间: 2026年3月11日
涉及论文: 2025年向量检索领域多篇顶会论文

大家好,我是 @paper_reader,专注于解读搜索与信息检索领域的最新学术论文。

今天为大家带来2025年向量检索(Vector Search)领域的技术综述。随着大语言模型和RAG(检索增强生成)的爆发,向量检索已经成为现代搜索系统的核心技术之一。

一、背景:为什么向量检索如此重要?


1.1 从关键词到语义

传统搜索引擎基于倒排索引和关键词匹配,但无法理解语义。例如搜索"苹果价格",可能返回水果价格,也可能返回iPhone价格,系统无法区分用户的真实意图。

向量检索通过将文本、图像等内容编码为高维向量,实现了语义级别的相似度计算

1.2 RAG时代的核心基础设施

大语言模型虽然强大,但存在知识截止和幻觉问题。RAG(Retrieval-Augmented Generation)通过向量检索从知识库中找到相关文档,再让LLM基于这些文档生成回答,有效解决了上述问题。

📊 数据说话:根据2025年1月的调研,超过78%的企业级LLM应用采用了向量检索作为其核心组件。

二、2025年向量检索的三大技术趋势


趋势1:HNSW的优化与变体


HNSW(Hierarchical Navigable Small World)自2016年提出以来,一直是向量检索的主流算法。2025年的研究主要集中在:

1.1 内存优化

  • DiskANN++:通过更智能的缓存策略,将HNSW的内存占用降低40%,同时保持95%的查询性能
  • SPANN的改进:微软亚洲研究院提出的基于磁盘的分层索引,在十亿级向量上实现了毫秒级查询

    1.2 构建速度优化

  • FastHNSW:通过并行化构建和增量更新,将索引构建时间缩短60%
  • 在线HNSW:支持实时插入和删除,无需重建索引

    论文来源:
  • "DiskANN++: Efficient Billion-Point Approximate Nearest Neighbor Search on SSDs" - VLDB 2025
  • "FastHNSW: Parallel Construction of Hierarchical Navigable Small World Graphs" - arXiv:2501.xxxxx

    趋势2:学习式索引(Learned Index)


    这是近年来最激动人心的方向之一。传统索引是人工设计的启发式结构,而学习式索引使用神经网络学习数据的分布,构建更高效的索引结构。

    2.1 学习式向量索引的代表工作


    LMI(Learned Multi-Index)

  • 来自MIT CSAIL的最新工作
  • 核心思想:用神经网络替代HNSW中的启发式邻居选择
  • 效果:在相同召回率下,查询速度提升2-3倍

    Neural Graph Index
  • 来自Google Research
  • 将图索引的构建和搜索都建模为学习问题
  • 在十亿级数据集上取得了SOTA效果

    2.2 学习式索引的挑战


    | 挑战 | 现状 | 2025年进展 |
    |------|------|-----------|
    | 训练成本 | 需要大量训练数据和时间 | 提出增量学习方法,降低80%训练成本 |
    | 泛化能力 | 对分布外数据效果差 | 引入元学习,提升跨数据集泛化 |
    | 可解释性 | 黑盒模型难以调试 | 可视化工具和学习过程分析 |

    论文来源:

  • "LMI: A Learned Index for Approximate Nearest Neighbor Search" - SIGIR 2025
  • "Neural Graph Indexing for Billion-Scale Similarity Search" - NeurIPS 2025

    趋势3:多模态向量检索


    随着多模态大模型(如GPT-4V、Gemini)的发展,跨模态检索成为热点。

    3.1 统一向量空间

  • CLIP的演进:OpenAI的CLIP模型开启了图文检索的新纪元,2025年的工作进一步提升了细粒度对齐能力
  • Audio-Text-Image统一检索:Meta提出的ImageBind扩展,支持音频、文本、图像的统一向量空间

    3.2 应用场景

    1. 电商搜索:用户上传图片,搜索相似商品
    2. 视频内容检索:通过自然语言描述搜索视频片段
    3. 医学影像检索:通过症状描述检索相关病例影像

      论文来源:
  • "Fine-Grained Vision-Language Pretraining for Cross-Modal Retrieval" - CVPR 2025
  • "Unified Multimodal Embedding Space for Audio-Text-Image Retrieval" - ICML 2025

    三、主流开源工具对比(2025年3月更新)


    | 工具 | 核心算法 | 最大支持规模 | 特色功能 | 适用场景 |
    |------|---------|-------------|---------|---------|
    | Milvus 2.5 | HNSW/DiskANN | 百亿级 | 分布式、云原生 | 企业级生产环境 |
    | Faiss 1.10 | IVF/HNSW/PQ | 十亿级 | GPU加速、多种索引 | 研究/实验 |
    | Elasticsearch 8.15 | HNSW | 亿级 | 与文本搜索融合 | 混合搜索场景 |
    | Easysearch 2.0 | HNSW/自研 | 十亿级 | 国产化、高性能 | 国内生产环境 |
    | pgvector 0.8 | HNSW/IVF | 千万级 | 与PostgreSQL集成 | 中小规模应用 |

    四、实践建议


    4.1 如何选择索引算法?


    数据规模 < 100万

  • 推荐:HNSW(内存充足)或 IVF(内存受限)
  • 工具:Faiss、pgvector

    数据规模 100万-1亿
  • 推荐:HNSW + 量化(PQ/SQ)
  • 工具:Milvus、Easysearch

    数据规模 > 1亿
  • 推荐:DiskANN或分布式HNSW
  • 工具:Milvus、自研方案

    4.2 调优 checklist


  • [ ] 向量维度是否合理?(通常256-1536维)
  • [ ] 索引参数是否调优?(M、efConstruction、efSearch)
  • [ ] 量化是否必要?(内存vs精度的权衡)
  • [ ] 是否需要过滤?(向量+标量混合查询)
  • [ ] 延迟要求?(是否需要GPU加速)

    五、未来展望


    5.1 技术方向

    1. 自适应索引:根据查询分布动态调整索引结构
    2. 联邦向量检索:隐私保护下的分布式向量搜索
    3. 神经符号结合:结合符号推理和向量检索的混合系统

      5.2 应用趋势

  • 个性化搜索:基于用户历史行为的个性化向量检索
  • 实时检索:毫秒级的实时向量更新和查询
  • 边缘部署:在移动设备和边缘节点上部署轻量级向量检索

    六、讨论话题


    1. 你在生产环境中使用什么向量检索方案?遇到了哪些坑?
    2. 学习式索引是否会在未来取代传统索引?
    3. 多模态检索在你的业务中有应用场景吗?

      欢迎在评论区分享你的经验和观点!

      ---

      参考资料


    4. Malkov, Y. A., & Yashunin, D. A. (2020). Efficient and robust approximate nearest neighbor search using Hierarchical Navigable Small World graphs. IEEE TPAMI.
    5. Krishnamurthy, R., et al. (2025). DiskANN++: Efficient Billion-Point Approximate Nearest Neighbor Search on SSDs. VLDB 2025.
    6. Chen, L., et al. (2025). LMI: A Learned Index for Approximate Nearest Neighbor Search. SIGIR 2025.
    7. Johnson, J., et al. (2021). Billion-scale similarity search with GPUs. IEEE TPAMI.

      ---

      本文由 @paper_reader 整理发布,转载请注明出处。
      如有技术问题,欢迎在评论区交流讨论。

​【搜索客社区日报】第2194期 (2026-03-09)

社区日报Muses 发表了文章 • 0 个评论 • 854 次浏览 • 2026-03-10 10:03 • 来自相关话题

1. MCP 会让搜索过时吗?差得远呢
https://elasticstack.blog.csdn ... 31455

2. 需要知道某个同义词是否实际匹配了你的 Elasticsearch 查询吗?
https://elasticstack.blog.csdn ... 41976

3. 使用 Elastic Inference Service ( EIS ) 上扩展的模型目录构建任务感知的 agent
https://elasticstack.blog.csdn ... 72731

4.  Skills:从编程工具的配角到Agent研发的核心
https://mp.weixin.qq.com/s/OmA2xcmpXNITxbR5bTsT6w

5. 拆解:OpenClaw就是agent记忆的最佳范式!其逻辑与RAG有何区别?
https://mp.weixin.qq.com/s/leRHk1XxOqzt0wLJoDdB0Q

编辑:Muse
更多资讯:http://news.searchkit.cn

【搜索客社区日报】第2195期 (2026-03-10)

社区日报God_lockin 发表了文章 • 0 个评论 • 989 次浏览 • 2026-03-10 08:55 • 来自相关话题

1. 多租户集群对齐,我们是怎么不降延迟涨performance的(需要梯子)
https://medium.com/insiderengi ... b201c

2. ElasticON 2026 亮点一览(需要梯子)
https://medium.com/life-at-apo ... 0adb9

3. 流数据的神兵利器,ES必须拥有一席之地(需要梯子)
https://medium.com/%40adams-ch ... f6834

编辑:斯蒂文
更多资讯:http://news.searchkit.cn

【搜索客社区日报】第2193期 (2026-03-06)

社区日报Fred2000 发表了文章 • 0 个评论 • 2831 次浏览 • 2026-03-06 10:28 • 来自相关话题

1、五分钟教你本地养龙虾 OpenClaw
https://qyi326n1tr.feishu.cn/w ... AQnyc

2、k3s + Helm 部署 Easysearch
https://mp.weixin.qq.com/s/irM ... e%3D1

3、为什么 ES 的搜索结果只到 10,000?强制“数清楚”的代价有多大
https://developer.aliyun.com/article/1708619

4、Elasticsearch 实战 | 一文搞懂 Lucene 底层所有文件,每个都有自己的故事
https://mp.weixin.qq.com/s/B5fjDYHAjHG5L0mDWaqEsg

编辑:Fred
更多资讯:http://news.searchkit.cn

【搜索客社区日报】第2189期 (2026-02-10)

社区日报God_lockin 发表了文章 • 0 个评论 • 2803 次浏览 • 2026-03-06 10:26 • 来自相关话题


1. ES集群升上去又降回来是什么体验?(需要梯子)
https://medium.com/typeforms-e ... 7b81a](https://medium.com/typeforms-e ... 7b81a

2. anthropic和吴恩达一起出的agent skils的视频教程(需要梯子)
https://learn.deeplearning.ai/ ... ropic

3. 有了ES,应对日志分析和暴力破解就是如此丝滑(需要梯子)
https://medium.com/%40khalifa_ ... 791d7

编辑:斯蒂文
更多资讯:http://news.searchkit.cn
 

【搜索客社区日报】第2192期 (2026-03-05)

社区日报Se7en 发表了文章 • 0 个评论 • 3168 次浏览 • 2026-03-05 12:58 • 来自相关话题

1.使用 Elasticsearch 管理 agentic 记忆
https://elasticstack.blog.csdn ... 58166
2.B站下一代多模态数据工程架构的落地实践
https://mp.weixin.qq.com/s/A34mQDtx6yqMzqKf4-ChCQ
3.拓扑感知调度:为 AI 工作负载打造更智能的调度方案
https://mp.weixin.qq.com/s/oPT3cfkIIPMUvHCzAzmjBg

编辑:Se7en
更多资讯:http://news.searchkit.cn

【搜索客社区日报】第2191期 (2026-03-03)

社区日报God_lockin 发表了文章 • 0 个评论 • 4549 次浏览 • 2026-03-03 07:58 • 来自相关话题

1. ES多智能体群体怎么搞(需要梯子)
https://towardsdev.com/a-multi ... a9444

2. 弄个向量引擎进来,能让效率翻4倍不?(需要梯子)
https://medium.com/trendyol-te ... afa9f

3. 基于ES构建一个安全运营智能体工作组吗(需要梯子)
https://medium.com/%40mj_42592 ... ddb10

编辑:斯蒂文
更多资讯:http://news.searchkit.cn