申请试用
HOT
登录
注册
 

高质量多模态视觉指令自动生成与修正-VIGC

亮点介绍: 1. 多模态大模型训练流程介绍 2. 高质量图文指令数据现状分析 3. 视觉指令微调数据自动生成方案VIGC介绍
时间
2023/12/14 19:00 - 20:00
人数
50
地点
研讨会直播
593人浏览
会议详情

近期,谷歌发布新一代大模型Gemini 再次引发了人们对多模态人工智能领域的关注。根据谷歌在YouTube上发布的演示视频“与Gemini亲密互动:与多模态AI交互”,展示了Gemini对图像和语音等提示做出了非常流畅且灵活的反馈。


然而要想训练一个性能强大的多模态大模型,高质量的图文对话指令微调数必不可少。当前多模态指令微调数据多基于纯文本GPT-4构建,其数据质量及多样性相对受限。如何更低成本、高效率地自动生成多样性的指令数据?如何基于指令修正模块减少幻觉,保证数据质量,进一步提升模型性能?


12月14日(周四)19:00 上海人工智能实验室青年研究员 大模型数据基座团队算法负责人 王斌将带我们一探究竟,欢迎报名~

活动
文档
专题
博客
确认
3秒后跳转登录页面
去登陆