EMAGE:上传音频就能生成全身动作 包括头部、嘴型、身体运动
划重点:
⭐️ 提出了 EMAGE 框架,上生成身体用于从音频和掩码手势生成全身人类手势。传音
⭐️ 引入了新的全身全面共话数据集 BEATX,结合 MoShed SMPLX 身体与 FLAME 头部参数,动作提高了建模质量。包括
⭐️ EMAGE 利用掩码手势先验信息进行训练,头部采用 Masked Audio Gesture Transformer 实现音频到手势生成,嘴型取得了最先进的运动性能。
CSS站长资源(ChinaZ.com)4月3日 消息:最近,上生成身体多所知名大学和研究机构的传音研究人员共同提出了 EMAGE 框架,旨在从音频和掩码手势生成全身人类手势。全身
EMAGE技术能实现输入音频生成全身动作,动作包括头部、包括嘴型、头部身体、嘴型手部和整体运动,跟之前Meta的audio2photoreal很像。用户只要上传音频(小于60秒),然后点击提交,输出结果将在输出中呈现3分钟。
他们引入了新的全面共话数据集 BEATX,该数据集结合了 MoShed SMPLX 身体和 FLAME 头部参数,进一步提高了建模质量,特别是对头部、颈部和手指动作的建模。EMAGE 在训练过程中利用了掩码手势的先验信息,以提高推断性能。该框架包括一个 Masked Audio Gesture Transformer,有助于联合训练音频到手势生成和掩码手势重建,有效地编码音频和身体手势提示。从掩码手势中编码的身体提示随后分别用于生成面部和身体动作。
此外,EMAGE 自适应地合并了音频的节奏和内容的语音特征,并利用了四个组合 VQ-VAE 来增强结果的保真度和多样性。实验证明,EMAGE 具有最先进的性能,能够生成具有完整的、音频同步的整体手势。
EMAGE 技术的问世将在各个领域产生深远影响,其中包括但不限于教育、医疗、娱乐等领域。研究团队表示,他们的代码和数据集已经公开提供,供学术和工业界使用。
项目入口:https://top.aibase.com/tool/emage
在线体验:https://huggingface.co/spaces/H-Liu1997/EMAGE
(责任编辑:小程序)
- ·今天北方小年!卢伟冰推荐小米13 Ultra:随手一拍就是年味大片
- ·多家品牌紧急致歉空包外卖:胖猫姐姐呼吁网友不要再叫外卖祭奠
- ·华为正式告别P系列!P60从华为商城下架 Pura70接棒
- ·拍下周鸿祎二手迈巴赫 买家褚会长回应:经筹措990万已完成付款
- ·考古了!苹果给安全研究员的iPhone 14 Pro送礼
- ·看好中国市场!库克:iPhone 15仍是中国最畅销手机 苹果无惧华为等竞争对手
- ·昆明蓝莓12元1盒震撼外地游客:价格太便宜
- ·Llama 3细节公布!AI产品总监站台讲解:Llama系列超庞大生态系统
- ·小米高管职务大变动!卢伟冰谈接手小米手机:巨大责任 光荣使命
- ·三星上架128GB版Galaxy S24:售价约为6502元人民币
- ·InstructIR:可按照人类指令进行高质量图像修复
- ·越来越多笔记本焊死内存 不让用户升级:惠普等厂商回应
- ·华为正式告别P系列!P60从华为商城下架 Pura70接棒
- ·V12 敞篷!法拉利12Cilindri Spider发布:满足国6B要求
- ·生财有道!高速遇堵车小货车用喇叭喊卖沃柑:1个半小时卖半车
- ·人类探索月背!嫦娥六号揭秘:三大关键技术应用
- ·990万卖掉自己二手迈巴赫!周鸿祎:这不是策划 钱全部捐掉一分不留
- ·今天“含龙量”超高 今年第3个龙年龙月龙日龙时到了
- ·真我GT5 Pro息屏指纹解锁来了!徐起:realme UI系统新升级 优化多项性能
- ·周鸿祎回应“迈巴赫中标者未付清余款”:已收到尾款