Q:非洲食人族的酋长吃什么?

【搜索客社区日报】第1868期 (2024-07-26)

社区日报searchkit 发表了文章 • 0 个评论 • 163 次浏览 • 20 小时前 • 来自相关话题

1、上半年拿到投资的 15 家 AI 搜索公司,他们都在做什么?
https://mp.weixin.qq.com/s/dSUEbsZ3gOmLEkQk--RJZw

2、最近硅谷人人都在讨论的GraphRAG到底是什么
https://mp.weixin.qq.com/s/Hx_nZItbwBL0XxckGnyXLg

3、减少 95% 资源的向量搜索 | 使用云搜索的 DiskANN
https://mp.weixin.qq.com/s/ddAv8X4qHKgfgpBkavLCPA

4、OpenSearch 向量检索和大模型方案深度解读
https://blog.51cto.com/u_15316473/8598095
 
🎉 活动预告:
【7月31日】第1期 | 2024 搜索客社区 Meetup 线上直播活动,主题:《Easysearch 结合大模型实现 RAG》
https://searchkit.cn/article/15209

编辑:Fred 
更多资讯:http://news.searchkit.cn

第1期 | 2024 搜索客社区 Meetup 线上直播活动,主题:Easysearch 结合大模型实现 RAG

活动searchkit 发表了文章 • 0 个评论 • 302 次浏览 • 1 天前 • 来自相关话题

2024 搜索客社区 Meetup 首期线上活动正式启动,本次活动由 搜索客社区、极限科技(INFINI Labs)联合举办,诚邀广大搜索技术开发者和爱好者参加交流学习。

活动时间:2024 年 7 月 31 日 19:30-20:30 (周三)
活动形式:微信视频号(极限实验室)直播
报名方式:关注或扫码海报中的二维码进行预约

![活动海报](https://infinilabs.cn/img/blog ... /1.png)

活动简介


在这个人工智能飞速发展的时代,ChatGPT 和 GPT-4 的出现无疑为人类带来了前所未有的震撼。我们不禁思考:通用人工智能的奇点是否真的即将来临?而最前沿的 AI 技术与最实用的落地应用之间的距离,又该如何缩短?

为了深入探讨这些问题,我们特别邀请到了极限科技(INFINI Labs)高级解决方案架构师、《老杨玩搜索》栏目 B 站 UP 主——杨帆先生,为我们带来一场主题为 “Easysearch 结合大模型实现 RAG” 的精彩演讲。

嘉宾介绍


杨帆,拥有十余年金融行业服务工作经验,熟悉 Linux、数据库、网络等领域。目前主要从事 Easysearch、Elasticsearch 等搜索引擎的技术支持工作,服务国内私有化部署的客户。他的丰富经验和深刻见解,将为我们揭开 AI 技术与实际应用之间的神秘面纱。

演讲主题


《Easysearch 结合大模型实现 RAG》

主题摘要


在本次演讲中,杨帆将跟大家分享和探讨以下几个方面:

  1. LangChain 简介:LangChain 的作用是什么?它由哪些组件构成,优势是什么。
  2. RAG 的背景及其局限性:RAG 出现以前的我们是如何获取信息的,RAG 解决了什么问题?它就是最终的答案了吗?
  3. LangChain 下的 RAG 工作流:在 LangChain 的框架下,实现 RAG 的步骤是怎样的。
  4. RAG Demo:使用 ollama 部署本地模型,利用 LangChain 集成 Easysearch 和 LLM , 开发 QA 问答系统

    活动亮点


    • 前沿技术分享: 深入了解当前 AI 领域的最新动态和发展趋势。
    • 实战经验交流: 学习如何在实际工作中应用这些先进技术。
    • 互动问答环节: 与演讲嘉宾直接对话,解答你的疑惑。

      参与有奖


      本次直播活动中设置了随机抽奖环节,奖品为 INFINI Labs 周边纪念品,包括 T 恤、鸭舌帽、咖啡杯、指甲刀套件等等(图片仅供参考,款式、颜色与尺码随机)。

      ![抽奖礼品](https://infinilabs.cn/img/blog ... ts.png)

      活动交流


      活动交流群二维码 7 天内(8 月 1 日前)有效,如过期请添加小助手微信拉群。活动最新消息也会在群内及时同步,欢迎大家参与,记得先预约,精彩内容不错过!

      ![活动交流](https://infinilabs.cn/img/blog ... /2.jpg)

      讲师招募


      ![讲师招募](https://infinilabs.cn/img/blog ... ng.png)

      搜索客社区 Meetup 讲师持续招募中...

      这是一个由搜索客社区精心组织策划的线下线上技术交流活动,我们诚挚邀请各位技术大咖、行业精英踊跃提交演讲议题。Meetup 活动将聚焦 AI 与搜索领域的最新动态,以及数据实时搜索分析、向量检索、技术实践与案例分析、日志分析、安全等领域的深度探讨。详情参见:[http://cfp.searchkit.cn](http://cfp.searchkit.cn) 。我们热切期待您的精彩分享!

      关于 搜索客(SearchKit)社区


      搜索客社区由 Elasticsearch 中文社区进行全新的品牌升级,以新的 Slogan:“搜索人自己的社区” 为宣言。汇集搜索领域最新动态、精选干货文章、精华讨论、文档资料、翻译与版本发布等,为广大搜索领域从业者提供更为丰富便捷的学习和交流平台。社区官网:[https://searchkit.cn](https://searchkit.cn) 。

      Easysearch 有奖征文活动推荐


      ![黑神话悟空](https://infinilabs.cn//img/blo ... er.png)

      无论你是 Easysearch 的老用户,还是第一次听说这个名字,只要你对 INFINI Labs 旗下的 Easysearch 产品感兴趣,或者是希望了解 Easysearch,都可以参加这次活动。

      详情查看:[Easysearch 征文活动](https://infinilabs.cn/blog/202 ... ukong/)

【搜索客社区日报】第1867期 (2024-07-25)

社区日报Se7en 发表了文章 • 0 个评论 • 297 次浏览 • 1 天前 • 来自相关话题

1.Llama 3.1正式发布:4050亿参数模型开源,小扎:把开源进行到底
https://mp.weixin.qq.com/s/yXz5kuiUNQFdTUdHQITL2Q
2.开源仅 1 天就斩获近万星!超越 RAG、让大模型拥有超强记忆力的 Mem0 火了!
https://mp.weixin.qq.com/s/ZJUD2n5RZ6XCF3aZ53SpGw
3.MySQL新版恶性Bug,表太多就崩给你看
https://mp.weixin.qq.com/s/LTlR65SY7ZOpPFGH0kUsVg

编辑:Se7en  
更多资讯:http://news.searchkit.cn

搜索客社区日报 第1866期 (2024-07-24)

社区日报kin122 发表了文章 • 0 个评论 • 388 次浏览 • 2 天前 • 来自相关话题

1.RAG 工业落地方案框架(Qanything、RAGFlow、FastGPT、智谱RAG)细节比对
https://mp.weixin.qq.com/s/z8CcFi03kQMGoEEQbuHzxw
2.Elasticsearch 中的位向量
https://blog.csdn.net/UbuntuTo ... 22765
3.介绍 Elasticsearch 中的 Learning to Tank - 学习排名
https://blog.csdn.net/UbuntuTo ... 64162

编辑:kin122 
更多资讯:http://news.searchkit.cn

es8使用版本7的Rest-High-Level-client失败

ElasticsearchCharele 回复了问题 • 2 人关注 • 1 个回复 • 412 次浏览 • 21 小时前 • 来自相关话题

【搜索客社区日报】第1865期 (2024-07-23)

社区日报God_lockin 发表了文章 • 0 个评论 • 683 次浏览 • 3 天前 • 来自相关话题



1. 没想到吧,我还能在树莓派上搭ES
https://medium.com/%40npan1990 ... 49770
2. 我是怎么在k8s上搭建elk全家的?
https://medium.com/%40degola/i ... bf199
3. 用RAG进一步提升AI powered searching的能力
https://medium.com/gitconnecte ... 4b1f8
编辑:斯蒂文
更多资讯:http://news.searchkit.cn
 

【搜索客社区日报】第1864期 (2024-07-22)

社区日报Muses 发表了文章 • 0 个评论 • 751 次浏览 • 4 天前 • 来自相关话题

1. 与 AI-RAN 联盟、3GPP 和 O-RAN 一起推动 6G 领域的 AI 驱动创新
https://developer.nvidia.com/b ... -ran/

2. 2024 年最值得关注的 8 个 AI 博客
https://www.greataiprompts.com ... logs/

3. 什么是 AI 代理?
https://www.technologyreview.c ... ents/

4. GPT-4o mini:推进成本效益型智能
https://openai.com/index/gpt-4 ... ence/

5. 2024 年数据库管理的未来
https://www.knowledgehut.com/b ... uture

编辑:Muse 
更多资讯:http://news.searchkit.cn

【搜索客社区日报】第1863期 (2024-07-19)

社区日报Fred2000 发表了文章 • 0 个评论 • 1174 次浏览 • 2024-07-19 11:32 • 来自相关话题

1、TDBC 2024 可信数据库发展大会上,《搜索型数据库白皮书》正式发布,附下载地址
https://infinilabs.cn/blog/2024/news-20240718/

2、较 ClickHouse 降低 50% 成本,湖仓一体在B站的演进
https://dbaplus.cn/news-131-5889-1.html

3、LangChain 实战:RAG 遇上大模型,运维革命就开始了……
https://dbaplus.cn/news-73-5978-1.html

4、OpenSearch 的演进与语义检索技术革新
https://blog.csdn.net/kunpengt ... 16513

编辑:Fred 
更多资讯:http://news.searchkit.cn

【搜索客社区日报】第1862期 (2024-07-18)

社区日报Se7en 发表了文章 • 0 个评论 • 1274 次浏览 • 2024-07-18 12:22 • 来自相关话题

1.推动 AI 革命:PyTorch 纪录片
https://mp.weixin.qq.com/s/lpT-8yQA8wAcxdjuBc88Ew
2.AIGC 提示词可视化编辑器 OPS
https://github.com/Moonvy/OpenPromptStudio
3.Facebook 为什么要弃用 Git?
https://mp.weixin.qq.com/s/n2UVEx8giKROJR9NWZB8pA
4.机场出租车恶性循环与国产数据库怪圈
https://mp.weixin.qq.com/s/uccjOkAR1zgur6tftHkzMg
5.被AI加持后的夸克,强大的让我有些陌生
https://mp.weixin.qq.com/s/RZ6J3v79bLOv6vhAm4nYLw

编辑:Se7en  
更多资讯:http://news.searchkit.cn

Easysearch 新特性:写入限流功能介绍

EasysearchINFINI Labs 小助手 发表了文章 • 0 个评论 • 1434 次浏览 • 2024-07-17 14:52 • 来自相关话题

背景


在 Easysearch 的各种使用场景中,高写入吞吐量的场景占了很大一部分,由此也带来了一些使用上的问题,很多用户由于使用经验不足,对集群的写入压测进行的不够充分,不能很好的规划集群的写入量。

导致经常发生以下问题:

  • 写入吞吐量过大对内存影响巨大,引发节点 OOM,节点掉线问题。
  • 对 CPU 和内存的占用严重影响了其他的查询业务的响应。
  • 以及磁盘 IO 负载增加,挤占集群的网络带宽等问题。

    之前就有某金融保险类客户遇到了因业务端写入量突然猛增导致数据节点不停的 Full GC,进而掉入了不停的掉线,上线,又掉线的恶性循环中。当时只能建议用户增加一个类似“挡板”的服务,在数据进入到集群之前进行拦截,对客户端写入进行干预限流:

    ![](https://infinilabs.cn/img/blog ... /1.png)

    这样做虽然有效,但是也增加了整个系统的部署复杂性,提高了运维成本。

    根据客户的实际场景,Easysearch 从 1.8.0 版本开始引入了节点和 Shard 级别的限流功能,不用依赖第三方就可以限制写入压力,并在 1.8.2 版本增加了索引级别的写入限流。
    注意:所有写入限流都是针对各数据节点的 Primary Shard 写入进行限流的,算上副本的话吞吐量要乘以 2。

    限流示意图:

    ![](https://infinilabs.cn/img/blog ... /2.png)

    下面是限流前后相同数据节点的吞吐量和 CPU 对比:

    测试环境:

    <br /> ip name http port version role master<br /> 10.0.0.3 node-3 10.0.0.3:9209 9303 1.8.0 dimr -<br /> 10.0.0.3 node-4 10.0.0.3:9210 9304 1.8.0 im -<br /> 10.0.0.3 node-2 10.0.0.3:9208 9302 1.8.0 dimr -<br /> 10.0.0.3 node-1 10.0.0.3:9207 9301 1.8.0 dimr *<br />

    测试索引配置:

    <br /> PUT test_0<br /> {<br /> "settings": {<br /> "number_of_replicas": 1,<br /> "number_of_shards": 3<br /> }<br /> }<br />

    压测工具:采用极限科技的 [INFINI Loadgen](https://infinilabs.cn/docs/lat ... hmark/) 压测,这款压测工具使用简单,可以方便对任何支持 Rest 接口的库进行压测。

    压测命令:

    bash<br /> ./loadgen-linux-amd64 -d 180 -c 10 -config loadgen-easy-1.8.yml<br />

    压测 180 秒,10 个并发,每个 bulk 请求 5000 条。

    节点级别限流


    通过 [INFINI Console](https://infinilabs.cn/products/console/) 监控指标可以看到,限流之前的某个数据节点,CPU 占用 10%,每秒写入 40000 条左右:

    ![](https://infinilabs.cn/img/blog ... /3.png)

    在 Cluster Settings 里配置,启用节点级别限流,限制每个节点的每秒最大写入 10000 条,并在默认的 1 秒间隔内进行重试,超过默认间隔后直接拒绝。

    <br /> PUT _cluster/settings<br /> {<br /> "transient": {<br /> "cluster.throttle.node.write": true,<br /> "cluster.throttle.node.write.max_requests": 10000,<br /> "cluster.throttle.node.write.action": "retry"<br /> }<br /> }<br />

    限流后,CPU 占用降低了约 50%,算上副本一共 20000 条每秒:

    ![](https://infinilabs.cn/img/blog ... /4.png)

    Shard 级别限流


    设置每个分片最大写入条数为 2000 条每秒

    <br /> PUT _cluster/settings<br /> {<br /> "transient": {<br /> "cluster.throttle.shard.write": true,<br /> "cluster.throttle.shard.write.max_requests": 2000,<br /> "cluster.throttle.shard.write.action": "retry"<br /> }<br /> }<br />

    集群级别的监控,同样是只针对主 Shard。

    ![](https://infinilabs.cn/img/blog ... /5.png)

    从 Console 的监控指标可以看出,索引 test_0 的 Primary indexing 维持在 6000 左右,正好是 3 个主分片限制的 2000 的写入之和。

    ![](https://infinilabs.cn/img/blog ... /6.png)

    再看下数据节点监控,Total Shards 表示主分片和副本分片的写入总和即 4000,单看主分片的话,正好是 2000.

    ![](https://infinilabs.cn/img/blog ... /7.png)

    索引级别限流


    有时,集群中可能某个索引的写入吞吐过大而影响了其他业务,也可以针对特定的索引配置写入限制。
    可以在索引的 Settings 里设置当前索引每秒写入最大条数为 6000:

    <br /> PUT test_0<br /> {<br /> "settings": {<br /> "number_of_replicas": 1,<br /> "number_of_shards": 3,<br /> "index.throttle.write.max_requests": 6000,<br /> "index.throttle.write.action": "retry",<br /> "index.throttle.write.enable": true<br /> }<br /> }<br />

    下图索引的 Primary indexing 在 6000 左右,表示索引的所有主分片的写入速度限制在了 6000。

    ![](https://infinilabs.cn/img/blog ... /8.png)

    总结


    通过本次测试对比,可以看出限流的好处:

    1. 有效控制写入压力:
      写入限流功能能够有效限制每个节点和每个 Shard 的写入吞吐量,防止因写入量过大而导致系统资源被过度消耗的问题。

    2. 降低系统资源占用:
      在限流前,某数据节点的 CPU 占用率约为 10%。限流后,CPU 占用率显著降低至约 5%,减少了约 50%。这表明在高并发写入场景下,写入限流功能显著降低了系统的 CPU 负载。

    3. 提高系统稳定性:
      通过控制写入吞吐量,避免了频繁的 Full GC 和节点掉线问题,从而提升了系统的整体稳定性和可靠性。

    4. 保障查询业务性能:
      写入限流功能减少了写入操作对 CPU 和内存的占用,确保其他查询业务的响应性能不受影响。

      综上所述,写入限流功能在高并发写入场景下表现出色,不仅有效控制了写入压力,还显著降低了系统资源占用,从而提高了系统的稳定性和查询业务的性能。

      关于 Easysearch 有奖征文活动


      ![黑神话悟空](https://infinilabs.cn//img/blo ... er.png)

      无论你是 Easysearch 的老用户,还是第一次听说这个名字,只要你对 INFINI Labs 旗下的 Easysearch 产品感兴趣,或者是希望了解 Easysearch,都可以参加这次活动。

      详情查看:[Easysearch 征文活动](https://infinilabs.cn/blog/202 ... ukong/)

      作者:张磊

      原文:https://infinilabs.cn/blog/202 ... tion/

【搜索客社区日报】第1859期 (2024-07-15)

社区日报searchkit 发表了文章 • 0 个评论 • 1399 次浏览 • 2024-07-17 14:50 • 来自相关话题

1. Easysearch 新特性:写入限流功能介绍
https://infinilabs.cn/blog/202 ... tion/

2. 中文大模型基准测评2024年上半年报告
https://report.oschina.net/api ... o.pdf

3. ClickHouse 24.6 版本发布说明
https://mp.weixin.qq.com/s/JrAikqoUMjHHuaLEHZptew

4. 斯坦福年度《人工智能指数报告》的十条重要结论
https://cn.weforum.org/agenda/ ... t-cn/

5. 面壁智能首席科学家刘知远:大模型的“摩尔定律”是模型知识密度持续增强 
https://www.tsinghua.edu.cn/info/1182/112713.htm

编辑:Muse
更多资讯:http://news.searchkit.cn

搜索客社区日报 第1861期 (2024-07-17)

社区日报kin122 发表了文章 • 0 个评论 • 1382 次浏览 • 2024-07-17 11:54 • 来自相关话题

1.ES 慢上游响应问题优化在用户体验场景中的实践
https://mp.weixin.qq.com/s/L_inW26azHHmp7n3WVBrZg
2.Elasticsearch:介绍 retrievers - 搜索一切事物
https://blog.csdn.net/UbuntuTo ... 61405
3.LLM,GPT-1 — 生成式预训练 Transformer(搭梯)
https://towardsdatascience.com ... 96d3b
4.LLM,GPT-2——语言模型是无监督的多任务学习者(搭梯)
https://towardsdatascience.com ... 1f808
5.LLM,GPT-3:语言模型是小样本学习者(搭梯)
https://towardsdatascience.com ... 1b466


编辑:kin122 
更多资讯:http://news.searchkit.cn

【搜索客社区日报】第1860期 (2024-07-16)

社区日报God_lockin 发表了文章 • 0 个评论 • 1540 次浏览 • 2024-07-16 12:57 • 来自相关话题

1. 可灵内测了,果断冲一波吧
https://klingai.kuaishou.com/

2. 一个还不错的语音复制模型
https://github.com/babysor/MockingBird
https://zhuanlan.zhihu.com/p/425692267

3. 一个算法比赛相关信息的收录站
https://oi-wiki.org/

编辑:斯蒂文
更多资讯:http://news.searchkit.cn

【搜索客社区日报】第1858期 (2024-07-12)

社区日报Fred2000 发表了文章 • 0 个评论 • 2106 次浏览 • 2024-07-12 14:05 • 来自相关话题

1、中文大模型基准测评上半年报告:GPT-4o 排名第一、通义千问 “国服最强”
https://www.oschina.net/news/301339

2、高级 RAG 检索策略之流程与模块化
https://mp.weixin.qq.com/s/WeAcAevUPemPKhQLhId3Vg

3、下一代 RAG 技术来了!微软正式开源 GraphRAG:大模型行业将迎来新的升级?
https://www.infoq.cn/article/sqaUMyNg6B8OrCcwg4vo

4、电商场景下 ES 搜索引擎的稳定性治理实践
https://mp.weixin.qq.com/s/fAgAgWWYJbbfcGGx1BpLsw

5、玩转 Easysearch 语法
https://infinilabs.cn/blog/202 ... ntax/

编辑:Fred 
更多资讯:http://news.searchkit.cn

邀请函 | 极限科技全新搜索引擎 INFINI Pizza 亮相 2024 可信数据库发展大会!

活动INFINI Labs 小助手 发表了文章 • 0 个评论 • 2117 次浏览 • 2024-07-12 09:30 • 来自相关话题

![](https://infinilabs.cn/img/blog ... ology’s-new-search-engine-infini-pizza-was-unveiled-at-the-2024-trusted-database-development-conference/bg.png)

过去一年,在全球 AI 浪潮和国家数据局成立的推动下,数据库产业变革不断、热闹非凡。2024 年,站在中国数字经济产业升级和数据要素市场化建设的时代交汇点上,“2024 可信数据库发展大会” 将于 2024 年 7 月 16-17 日在北京悠唐皇冠假日酒店隆重召开,大会将以 “自主、创新、引领” 为主题,以期进一步推动全球数据库产业进步,共同开创可信数据库行业的新时代。

届时,极限科技(INFINI Labs)创始人兼 CEO 曾勇 将于 7 月 17 日下午在 搜索与分析型数据库&多模数据库分论坛 发表主题演讲 《下一代万亿级实时搜索引擎的设计与思考》 ,主要介绍下一代纯实时搜索新引擎 INFINI Pizza 的设计思路与软件架构的思考以及复杂场景下的搜索需求和挑战,敬请期待!

![](https://infinilabs.cn/img/blog ... ology’s-new-search-engine-infini-pizza-was-unveiled-at-the-2024-trusted-database-development-conference/1.jpg)

![](https://infinilabs.cn/img/blog ... ology’s-new-search-engine-infini-pizza-was-unveiled-at-the-2024-trusted-database-development-conference/2.jpg)

关于极限科技(INFINI Labs)


![INFINI Labs](https://infinilabs.cn/img/blog ... bs.png)

极限科技,全称极限数据(北京)科技有限公司,是一家专注于实时搜索与数据分析的软件公司。旗下品牌极限实验室(INFINI Labs)致力于打造极致易用的数据探索与分析体验。

极限科技是一支年轻的团队,采用天然分布式的方式来进行远程协作,员工分布在全球各地,希望通过努力成为中国乃至全球企业大数据实时搜索分析产品的首选,为中国技术品牌输出添砖加瓦。

官网:[https://www.infinilabs.cn](https://www.infinilabs.cn)

![联系我们](https://infinilabs.cn/img/blog ... us.png)