亮点介绍:
1. 多模态大模型训练流程介绍
2. 高质量图文指令数据现状分析
3. 视觉指令微调数据自动生成方案VIGC介绍
593人浏览
会议详情
近期,谷歌发布新一代大模型Gemini 再次引发了人们对多模态人工智能领域的关注。根据谷歌在YouTube上发布的演示视频“与Gemini亲密互动:与多模态AI交互”,展示了Gemini对图像和语音等提示做出了非常流畅且灵活的反馈。
然而要想训练一个性能强大的多模态大模型,高质量的图文对话指令微调数必不可少。当前多模态指令微调数据多基于纯文本GPT-4构建,其数据质量及多样性相对受限。如何更低成本、高效率地自动生成多样性的指令数据?如何基于指令修正模块减少幻觉,保证数据质量,进一步提升模型性能?
12月14日(周四)19:00 上海人工智能实验室青年研究员 大模型数据基座团队算法负责人 王斌将带我们一探究竟,欢迎报名~
确认
3秒后跳转登录页面
去登陆