申请试用
HOT
登录
注册
 

ROMP-单目、多人、实时三维人体形态估计

白玉兰开源
/
发布于
/
976
人观看

近年来,自单张图片估计三维人体形状和姿态的研究火热。但现有方法大多都遵从先检测-再逐人估计的多阶段框架。ROMP是第一个单阶段算法,可在1070Ti上自单个单目摄像头,实时估计多人三维人体网格。为了适应实际场景中普遍存在的多人遮挡问题,不同于多阶段方法的检测框级的模糊表征, ROMP端对端学习像素级的明确表征。并且为了让模型进一步适应严重遮挡的情况,我们在表征学习过程中融入了多人中心碰撞检测机制,促使模型学习更具有区分性的表征。
ROMP的模型结构采用了简洁的端对端设计,具有很强的可扩展性,便于借此进一步探索多人场景下更丰富的感知和交互功能。
ROMP的训练和测试代码已在Github上开源并积极维护,可以从图片、视频、摄像头中实时提取三维人体形态信息,并应用于虚拟形象驱动。

0点赞
0收藏
确认
3秒后跳转登录页面
去登陆