AI 时代产生了大量的非结构化数据,也对海量信息环境下的检索造成了巨大的挑战。
作为专为 AI 应用场景而生的云原生向量数据库 Milvus,在过去的 2 年间也不断地为降低开发者构建非结构化数据分析处理类应用的困难与成本寻找新的思路。
为帮助 Milvus 用户最大化发挥数据价值,寻找技术最佳实践,此次 Arch Meetup 将协同当地的开发者与生态伙伴走进各大城市,并围绕 #AI #大数据 #向量搜索等维度进行探讨。本次的 Arch Meetup 杭州站我们邀请到了来自 Zilliz、Kyligence、丁香园、有赞和 Juicedata 的多位大拿们为我们带来相关的思考与实践。
8 月 21 号 13:00PM, 与你相约 Arch Meetup-杭州站!👇
✨ 活动议程
✨ 议题简介
1. Milvus 2.0 主要进展 & roadmap
今年 6 月底,我们推出了 Milvus 2.0,得到了广大用户的关注,并收到了很多反馈和宝贵意见。Milvus 2.0 相比之前的版本,以拥抱云原生为目标,在系统上做了重构与完善。
本次分享将介绍社区正在进行的 Milvus 2.0 主要开发工作与未来的 roadmap。
2. 使用 Ray 作为 Spark SQL UDF 的执行引擎
这次分享我们会重点介绍如何基于 Ray 使用 Python 实现 Spark SQL UDF 函数,进一步的,我们使用该技术实现有状态的 UDF 函数,从而能够将常见的 Python 算法模型转换成 SQL UDF 函数使用,解决算法模型包装成 SQL 函数面临的两大难题:1. 函数需要一个初始化过程,2. 函数有一定的 Python 环境要求。
3. 向量检索在丁香园搜索场景的应用
主要分享在丁香园的业务场景下,短文本理解的技术实践,讨论知识图谱技术如何在医疗健康领域的搜索中落地应用。
4. Milvus 在有赞的业务场景与实践
有赞是一家致力于服务商家成功的企业, 在有赞精选、微商城、爱逛场景下存在大量的搜索需求,其中之一的场景就是商品的相似款推荐。我们通过 Milvus 搭建底层的向量搜索服务能力,用来支持各种文本搜文本、以图搜图的场景,并且期望系统具有高可用和高并发的能力。
本次分享主要集中在 Milvus 使用的业务场景、部署架构以及遇到的问题。
5. 基于 JuiceFS 搭建 Milvus 分布式集群
JuiceFS 是一款针对云原生环境设计的共享文件系统,支持所有类型数据的管理、分析、归档和备份,被广泛应用于大数据、人工智能、日志收集等场景。JuiceFS 支持多端数据共享,可以直接作为 Milvus 底层的共享存储。
本次分享将会详细介绍如何基于 JuiceFS 共享存储搭建 Milvus 分布式集群。
✨ 直播
不能到场的小伙伴也可以在家观看直播,直播链接请扫码入群后获取!
Arch Meetup
Arch Meetup 是由 Zilliz 所主办的 AI 与大数据时代下的向量搜索系列沙龙
围绕 #开源 #AI #大数据 & #云原生等主题进行探讨
很快的我们也将与你在以下的城市见面!
Arch Meetup#8 杭州站
Arch Meetup#9 北京站
Arch Meetup#10 深圳站