点击进入回放

高质量多模态视觉指令自动生成与修正-VIGC

亮点介绍： 1. 多模态大模型训练流程介绍 2. 高质量图文指令数据现状分析 3. 视觉指令微调数据自动生成方案VIGC介绍

时间

2023/12/14 19:00 - 20:00

人数

地点

研讨会直播

703人浏览

会议详情

近期，谷歌发布新一代大模型Gemini 再次引发了人们对多模态人工智能领域的关注。根据谷歌在YouTube上发布的演示视频“与Gemini亲密互动：与多模态AI交互”，展示了Gemini对图像和语音等提示做出了非常流畅且灵活的反馈。

然而要想训练一个性能强大的多模态大模型，高质量的图文对话指令微调数必不可少。当前多模态指令微调数据多基于纯文本GPT-4构建，其数据质量及多样性相对受限。如何更低成本、高效率地自动生成多样性的指令数据？如何基于指令修正模块减少幻觉，保证数据质量，进一步提升模型性能？

12月14日（周四）19:00 上海人工智能实验室青年研究员大模型数据基座团队算法负责人王斌将带我们一探究竟，欢迎报名~

OpenDataLab

活动

文档

专题

博客