三人行必有我师

【搜索客社区日报】 第1822期 (2024-05-21)


1、西瓜书的课后练习
https://github.com/hanmq/Machi ... mSets
2. 一本讲大语言模型的书,中文的
https://github.com/LLMBook-zh/LLMBook-zh.github.io
3. 每天生成HackerNews top帖子的中文摘要
https://www.supertechfans.com/cn/

编辑:斯蒂文
更多资讯:http://news.searchkit.cn
 
继续阅读 »

1、西瓜书的课后练习
https://github.com/hanmq/Machi ... mSets
2. 一本讲大语言模型的书,中文的
https://github.com/LLMBook-zh/LLMBook-zh.github.io
3. 每天生成HackerNews top帖子的中文摘要
https://www.supertechfans.com/cn/

编辑:斯蒂文
更多资讯:http://news.searchkit.cn
  收起阅读 »

【搜索客社区日报】 第1821期 (2024-05-20)

1、Elasticsearch集群“脑裂”现象
https://blog.csdn.net/qq_60735 ... 26464
2、ElasticSearch源码:Cluster--ClusterState
https://zhuanlan.zhihu.com/p/629394258
3、使用 Ingest Pipeline 来对 Elasticsearch 中数据进行预处理
https://mp.weixin.qq.com/s/1AFNEO25uEkTAF50FYHWIA
 
 
 
编辑:yuebancanghai
更多资讯:http://news.searchkit.cn
继续阅读 »
1、Elasticsearch集群“脑裂”现象
https://blog.csdn.net/qq_60735 ... 26464
2、ElasticSearch源码:Cluster--ClusterState
https://zhuanlan.zhihu.com/p/629394258
3、使用 Ingest Pipeline 来对 Elasticsearch 中数据进行预处理
https://mp.weixin.qq.com/s/1AFNEO25uEkTAF50FYHWIA
 
 
 
编辑:yuebancanghai
更多资讯:http://news.searchkit.cn 收起阅读 »

【搜索客社区日报】第1820期 (2024-05-16)

1.使用 Llama-3 通过 Groq 快速实现 GenAI 新闻摘要代理
https://pub.towardsai.net/llam ... eced3
2.Elasticsearch 在滴滴的应用与实践
https://mp.weixin.qq.com/s/nIYbtjzraQ9s-Lni24x42g
3.9 个步骤解释 Transformer 架构(需要梯子)
https://medium.com/data-at-the ... 1ee72
4.Kai - 生成式人工智能遇上应用现代化
https://mp.weixin.qq.com/s/Db4HbY0jVo0twoz9amJH1g


编辑:Se7en    
更多资讯:http://news.searchkit.cn
继续阅读 »
1.使用 Llama-3 通过 Groq 快速实现 GenAI 新闻摘要代理
https://pub.towardsai.net/llam ... eced3
2.Elasticsearch 在滴滴的应用与实践
https://mp.weixin.qq.com/s/nIYbtjzraQ9s-Lni24x42g
3.9 个步骤解释 Transformer 架构(需要梯子)
https://medium.com/data-at-the ... 1ee72
4.Kai - 生成式人工智能遇上应用现代化
https://mp.weixin.qq.com/s/Db4HbY0jVo0twoz9amJH1g


编辑:Se7en    
更多资讯:http://news.searchkit.cn 收起阅读 »

【搜索客社区日报】第1819期 (2024-05-14)

1. 一些质量还不错(且免费的)大模型的地址,如果某些特别好的用不了,可以试试第一梯队其他的solution(里面内容需要梯子)
https://www.bilibili.com/read/ ... s%3D1

2. 一些常见solution的常用命令合集
https://wangchujiang.com/reference/index.html

3. 把观众当5岁小朋友来教怎么用开源模型构建RAG应用(需要梯子)
https://www.youtube.com/watch?v=HRvyei7vFSM

编辑:斯蒂文
更多资讯:http://news.searchkit.cn
继续阅读 »
1. 一些质量还不错(且免费的)大模型的地址,如果某些特别好的用不了,可以试试第一梯队其他的solution(里面内容需要梯子)
https://www.bilibili.com/read/ ... s%3D1

2. 一些常见solution的常用命令合集
https://wangchujiang.com/reference/index.html

3. 把观众当5岁小朋友来教怎么用开源模型构建RAG应用(需要梯子)
https://www.youtube.com/watch?v=HRvyei7vFSM

编辑:斯蒂文
更多资讯:http://news.searchkit.cn 收起阅读 »

【搜索客社区日报】 第1818期 (2024-05-13)

1、ElasticSearch原理应用以及京东搜索案例
https://blog.csdn.net/weixin_5 ... 29406
2、【Elasticsearch源码】 检索分析
https://blog.csdn.net/jiankunk ... 31000
3、Elasticsearch 电商场景:明明有这个关键词,但是搜不出来,怎么办?
https://mp.weixin.qq.com/s/eTHZZTQWFaxgReNpa2mNaw


编辑:yuebancanghai
更多资讯:http://news.searchkit.cn
继续阅读 »
1、ElasticSearch原理应用以及京东搜索案例
https://blog.csdn.net/weixin_5 ... 29406
2、【Elasticsearch源码】 检索分析
https://blog.csdn.net/jiankunk ... 31000
3、Elasticsearch 电商场景:明明有这个关键词,但是搜不出来,怎么办?
https://mp.weixin.qq.com/s/eTHZZTQWFaxgReNpa2mNaw


编辑:yuebancanghai
更多资讯:http://news.searchkit.cn 收起阅读 »

【搜索客社区日报】第1817期 (2024-05-09)

1.在本地通过 WasmEdge 运行 Llama 3
https://mp.weixin.qq.com/s/Ovkb2DT39DMkoUBvwyjXZQ
2.你应该使用哪种向量数据库?(需要梯子)
https://medium.com/the-ai-foru ... ba133
3.别再用 Apache Lucene,下一代搜索引擎 Tantivy 无可匹敌!
https://mp.weixin.qq.com/s/hd1dQki2a4sFFvf1lfvI_A
4.GreptimeDB 社群观察报告
https://mp.weixin.qq.com/s/099jRv4Kal-4vEzyq1a6sg

编辑:Se7en    
更多资讯:http://news.searchkit.cn
继续阅读 »
1.在本地通过 WasmEdge 运行 Llama 3
https://mp.weixin.qq.com/s/Ovkb2DT39DMkoUBvwyjXZQ
2.你应该使用哪种向量数据库?(需要梯子)
https://medium.com/the-ai-foru ... ba133
3.别再用 Apache Lucene,下一代搜索引擎 Tantivy 无可匹敌!
https://mp.weixin.qq.com/s/hd1dQki2a4sFFvf1lfvI_A
4.GreptimeDB 社群观察报告
https://mp.weixin.qq.com/s/099jRv4Kal-4vEzyq1a6sg

编辑:Se7en    
更多资讯:http://news.searchkit.cn 收起阅读 »

【搜索客社区日报】第1816期 (2024-05-07)


1. 一篇多智能体协同分析和推荐的论文,让推荐系统从大模型刚出来的时候简单的学习、记忆进化到了多人(agent)协同的阶段了
https://arxiv.org/abs/2405.01847

2. 出版了几年了,不过还是帮普通玩家快速学会python以及做简单的数据分析工作的书
https://github.com/ShixiangWang/pybook

3. 沐神的频道,满满的全是干货(需要梯子)
https://www.youtube.com/@mu_li

编辑:斯蒂文
更多资讯:http://news.searchkit.cn
继续阅读 »

1. 一篇多智能体协同分析和推荐的论文,让推荐系统从大模型刚出来的时候简单的学习、记忆进化到了多人(agent)协同的阶段了
https://arxiv.org/abs/2405.01847

2. 出版了几年了,不过还是帮普通玩家快速学会python以及做简单的数据分析工作的书
https://github.com/ShixiangWang/pybook

3. 沐神的频道,满满的全是干货(需要梯子)
https://www.youtube.com/@mu_li

编辑:斯蒂文
更多资讯:http://news.searchkit.cn 收起阅读 »

【搜索客社区日报】 第1815期 (2024-05-06)

1、Elasticsearch源码:缓存
https://zhuanlan.zhihu.com/p/641937707
2、Elasticsearch7.17 五 :ES读写原理、分片设计和性能优化
https://blog.csdn.net/huaxinzh ... 72294
3、深入解读 Elasticsearch 热点线程 hot_threads
https://cloud.tencent.cn/developer/article/1746019


编辑:yuebancanghai
更多资讯:http://news.searchkit.cn
继续阅读 »
1、Elasticsearch源码:缓存
https://zhuanlan.zhihu.com/p/641937707
2、Elasticsearch7.17 五 :ES读写原理、分片设计和性能优化
https://blog.csdn.net/huaxinzh ... 72294
3、深入解读 Elasticsearch 热点线程 hot_threads
https://cloud.tencent.cn/developer/article/1746019


编辑:yuebancanghai
更多资讯:http://news.searchkit.cn 收起阅读 »

【搜索客社区日报】第1811期 (2024-04-30)

1. 看看外国老哥过认证工程师的心路历程(需要梯子)
https://medium.com/life-at-apo ... f33fd
2. 开源的最接近ChatGPT4的视觉模型,OpenAI还是强
https://github.com/OpenGVLab/InternVL
 
3. 在线使用llama3的地址,有些指标追平甚至超越ChatGPT的大模型
https://llama3.dev/
编辑:斯蒂文
更多资讯:http://news.searchkit.cn
 
继续阅读 »
1. 看看外国老哥过认证工程师的心路历程(需要梯子)
https://medium.com/life-at-apo ... f33fd
2. 开源的最接近ChatGPT4的视觉模型,OpenAI还是强
https://github.com/OpenGVLab/InternVL
 
3. 在线使用llama3的地址,有些指标追平甚至超越ChatGPT的大模型
https://llama3.dev/
编辑:斯蒂文
更多资讯:http://news.searchkit.cn
  收起阅读 »

INFINI Labs 产品更新 | Console 1.24.0 操作日志审计功能发布

release

INFINI Labs 产品又更新啦~,包括 Console,Gateway 1.24.0。本次各产品更新了很多亮点功能,如 Console 增加操作日志审计功能,优化数据探索字段统计,修复 Gateway 增加认证后添加实例失败等问题。以下是本次更新的详细说明。

INFINI Console v1.24.0

INFINI Console 是一款非常轻量级的多集群、跨版本的搜索基础设施统一管控平台。通过对流行的搜索引擎基础设施进行跨版本、多集群的集中纳管, 企业可以快速方便的统一管理企业内部的不同版本的多套搜索集群。

Console 在线体验: http://demo.infini.cloud (用户名/密码:readonly/readonly)。

Console 本次更新如下:

Features

  • 用户操作审计日志功能
  • 新增告警规则克隆一键克隆功能,简化重复类型告警的创建

Bug fix

  • 修复普通用户权限 403 问题
  • 修复探针管理表格展开显示错位问题

Improvements

  • 优化开发工具集群选择控件显示位置
  • 优化数据探索查询控件显示宽度
  • 优化数据探索字段统计功能
  • 优化告警规则列表页搜索,支持远程搜索
  • Discover 左侧字段聚合支持开关控制拉取本地或远程统计值

INFINI Gateway v1.24.0

INFINI Gateway 是一个面向搜索场景的高性能数据网关,所有请求都经过网关处理后再转发到后端的搜索业务集群。基于 INFINI Gateway 可以实现索引级别的限速限流、常见查询的缓存加速、查询请求的审计、查询结果的动态修改等等。

Gateway 本次更新如下:

Improvements

  • Refactoring http client tls config
  • Write field routing to bulk metadata when field _routing exists in scrolled doc

Bug fix

  • Fix(reshuffle filter): make sure queue config always have label type
  • Fix rotate config usage

INFINI Framework

Improvements

  • feat: allow to use default auth for agent’s auto enroll
  • refactor: refactor func GetFieldCaps
  • feat: register background job to clean up badger LSM tree
  • fix: skip load missing wal

期待反馈

欢迎下载体验使用,如果您在使用过程中遇到如何疑问或者问题,欢迎前往 INFINI Labs Github(https://github.com/infinilabs) 中的对应项目中提交 Feature Request 或提交 Bug。

您还可以通过邮件联系我们:hello@infini.ltd

或者拨打我们的热线电话:(+86) 400-139-9200

欢迎加入 Discord 聊天室:https://discord.gg/4tKTMkkvVX

也欢迎大家微信扫码添加小助手(INFINI-Labs),加入用户群一起讨论交流。

联系我们

关于极限科技(INFINI Labs)

INFINI Labs

极限科技,全称极限数据(北京)科技有限公司,是一家专注于实时搜索与数据分析的软件公司。旗下品牌极限实验室(INFINI Labs)致力于打造极致易用的数据探索与分析体验。

极限科技是一支年轻的团队,采用天然分布式的方式来进行远程协作,员工分布在全球各地,希望通过努力成为中国乃至全球企业大数据实时搜索分析产品的首选,为中国技术品牌输出添砖加瓦。

官网:https://www.infinilabs.cn

继续阅读 »

release

INFINI Labs 产品又更新啦~,包括 Console,Gateway 1.24.0。本次各产品更新了很多亮点功能,如 Console 增加操作日志审计功能,优化数据探索字段统计,修复 Gateway 增加认证后添加实例失败等问题。以下是本次更新的详细说明。

INFINI Console v1.24.0

INFINI Console 是一款非常轻量级的多集群、跨版本的搜索基础设施统一管控平台。通过对流行的搜索引擎基础设施进行跨版本、多集群的集中纳管, 企业可以快速方便的统一管理企业内部的不同版本的多套搜索集群。

Console 在线体验: http://demo.infini.cloud (用户名/密码:readonly/readonly)。

Console 本次更新如下:

Features

  • 用户操作审计日志功能
  • 新增告警规则克隆一键克隆功能,简化重复类型告警的创建

Bug fix

  • 修复普通用户权限 403 问题
  • 修复探针管理表格展开显示错位问题

Improvements

  • 优化开发工具集群选择控件显示位置
  • 优化数据探索查询控件显示宽度
  • 优化数据探索字段统计功能
  • 优化告警规则列表页搜索,支持远程搜索
  • Discover 左侧字段聚合支持开关控制拉取本地或远程统计值

INFINI Gateway v1.24.0

INFINI Gateway 是一个面向搜索场景的高性能数据网关,所有请求都经过网关处理后再转发到后端的搜索业务集群。基于 INFINI Gateway 可以实现索引级别的限速限流、常见查询的缓存加速、查询请求的审计、查询结果的动态修改等等。

Gateway 本次更新如下:

Improvements

  • Refactoring http client tls config
  • Write field routing to bulk metadata when field _routing exists in scrolled doc

Bug fix

  • Fix(reshuffle filter): make sure queue config always have label type
  • Fix rotate config usage

INFINI Framework

Improvements

  • feat: allow to use default auth for agent’s auto enroll
  • refactor: refactor func GetFieldCaps
  • feat: register background job to clean up badger LSM tree
  • fix: skip load missing wal

期待反馈

欢迎下载体验使用,如果您在使用过程中遇到如何疑问或者问题,欢迎前往 INFINI Labs Github(https://github.com/infinilabs) 中的对应项目中提交 Feature Request 或提交 Bug。

您还可以通过邮件联系我们:hello@infini.ltd

或者拨打我们的热线电话:(+86) 400-139-9200

欢迎加入 Discord 聊天室:https://discord.gg/4tKTMkkvVX

也欢迎大家微信扫码添加小助手(INFINI-Labs),加入用户群一起讨论交流。

联系我们

关于极限科技(INFINI Labs)

INFINI Labs

极限科技,全称极限数据(北京)科技有限公司,是一家专注于实时搜索与数据分析的软件公司。旗下品牌极限实验室(INFINI Labs)致力于打造极致易用的数据探索与分析体验。

极限科技是一支年轻的团队,采用天然分布式的方式来进行远程协作,员工分布在全球各地,希望通过努力成为中国乃至全球企业大数据实时搜索分析产品的首选,为中国技术品牌输出添砖加瓦。

官网:https://www.infinilabs.cn

收起阅读 »

【搜索客社区日报】第1810期 (2024-04-16)


1. 数据分析?一套elk全搞定(需要梯子)
https://medium.com/%40maiconsp ... ef63c
1. 一个可以生成包括歌曲、演讲、脱口秀在内的各种声音内容的AI平台
https://www.udio.com/
1. 世界主流VPS的测评
https://bigdata.icu/tools/vps.html#lisahost
 

编辑:斯蒂文
更多资讯:http://news.searchkit.cn
 
继续阅读 »

1. 数据分析?一套elk全搞定(需要梯子)
https://medium.com/%40maiconsp ... ef63c
1. 一个可以生成包括歌曲、演讲、脱口秀在内的各种声音内容的AI平台
https://www.udio.com/
1. 世界主流VPS的测评
https://bigdata.icu/tools/vps.html#lisahost
 

编辑:斯蒂文
更多资讯:http://news.searchkit.cn
  收起阅读 »

【搜索客社区日报】第1814期 (2024-04-25)

1.RAG敲响丧钟?大模型长上下文是否意味着向量检索不再重要
https://mp.weixin.qq.com/s/mz-MB7abcYKKbIXoGxnAHQ
2.在 Amazon EKS 上部署生成式 AI 模型
https://aws.amazon.com/cn/blog ... -eks/
3.NLP与LLMs: 了解差异
https://www.elastic.co/blog/nlp-vs-llms
4.Meta超大规模AI智算基础设施架构设计
https://mp.weixin.qq.com/s/aME8ltsRKyYGXfYZyATyxw

编辑:Se7en  
更多资讯:http://news.searchkit.cn
继续阅读 »
1.RAG敲响丧钟?大模型长上下文是否意味着向量检索不再重要
https://mp.weixin.qq.com/s/mz-MB7abcYKKbIXoGxnAHQ
2.在 Amazon EKS 上部署生成式 AI 模型
https://aws.amazon.com/cn/blog ... -eks/
3.NLP与LLMs: 了解差异
https://www.elastic.co/blog/nlp-vs-llms
4.Meta超大规模AI智算基础设施架构设计
https://mp.weixin.qq.com/s/aME8ltsRKyYGXfYZyATyxw

编辑:Se7en  
更多资讯:http://news.searchkit.cn 收起阅读 »

【搜索客社区日报】第1813期 (2024-04-23)

1. 一个按照历史来绘制战争战损动图/视频的博主
https://www.youtube.com/@mapsinanutshell

2. LLM 竞技场,各项任务中大语言模型的世界排名
https://chat.lmsys.org/?leaderboard

3. 热门图像生成相关论文
https://latentbox.com/zh/docs

编辑:斯蒂文
更多资讯:http://news.searchkit.cn
继续阅读 »
1. 一个按照历史来绘制战争战损动图/视频的博主
https://www.youtube.com/@mapsinanutshell

2. LLM 竞技场,各项任务中大语言模型的世界排名
https://chat.lmsys.org/?leaderboard

3. 热门图像生成相关论文
https://latentbox.com/zh/docs

编辑:斯蒂文
更多资讯:http://news.searchkit.cn 收起阅读 »

【搜索客社区日报】 第1812期 (2024-04-22)

1、Elasticsearch 配置文件 path.data 中可以配置多个数据目录的路径吗
https://mp.weixin.qq.com/s/hIt4KYJ9CXwfic1Sm-4UKw
2、使用ElasticSearch完成大模型+本地知识库
https://blog.csdn.net/weixin_5 ... 59865
3、elasticsearch数据迁移之elasticdump
https://blog.csdn.net/weixin_5 ... 16838


编辑:yuebancanghai
更多资讯:http://news.searchkit.cn
继续阅读 »
1、Elasticsearch 配置文件 path.data 中可以配置多个数据目录的路径吗
https://mp.weixin.qq.com/s/hIt4KYJ9CXwfic1Sm-4UKw
2、使用ElasticSearch完成大模型+本地知识库
https://blog.csdn.net/weixin_5 ... 59865
3、elasticsearch数据迁移之elasticdump
https://blog.csdn.net/weixin_5 ... 16838


编辑:yuebancanghai
更多资讯:http://news.searchkit.cn 收起阅读 »

【搜索客社区日报】第1811期 (2024-04-18)

1.Elastic 开源新项目:Universal Profiling Agent,通过 eBPF 为 Linux 实现一个全系统、跨语言的分析器
https://www.elastic.co/blog/el ... ource
2.使用 LLM 在本地计算机上运行的 Ollama Llama2 和 LlamaIndex 构建 RAG 应用程序(需要梯子)
https://medium.com/rahasak/bui ... 3db20
3.Rerank,让RAG更近一步
https://mp.weixin.qq.com/s/UxIZwR2w5Hcp-RecsgnckA
4.LlamaIndex 与 LangChain: 了解主要区别
https://datasciencedojo.com/bl ... hain/

编辑:Se7en  
更多资讯:http://news.searchkit.cn
继续阅读 »
1.Elastic 开源新项目:Universal Profiling Agent,通过 eBPF 为 Linux 实现一个全系统、跨语言的分析器
https://www.elastic.co/blog/el ... ource
2.使用 LLM 在本地计算机上运行的 Ollama Llama2 和 LlamaIndex 构建 RAG 应用程序(需要梯子)
https://medium.com/rahasak/bui ... 3db20
3.Rerank,让RAG更近一步
https://mp.weixin.qq.com/s/UxIZwR2w5Hcp-RecsgnckA
4.LlamaIndex 与 LangChain: 了解主要区别
https://datasciencedojo.com/bl ... hain/

编辑:Se7en  
更多资讯:http://news.searchkit.cn 收起阅读 »