阿里对口型项目EMO开启内测 可将照片转为唱歌视频
时间:2024-07-04 04:32:55 来源:带水拖泥网 作者:小程序 阅读:206次
CSS站长资源(ChinaZ.com)4月25日 消息:千呼万唤始出来!阿里对口型项目EMO终于开启内测了。阿里它能够将一张简单的对口照片转化为唱歌视频,为用户提供了一种全新的型项数字人出镜体验。
EMO模型的开启特点:
简便的操作: 用户只需提供一张照片和克隆的语音模型,即可定制自己的内测数字人像。
低成本: 与Heygen等需要录制长视频和高算力成本的照片转产品相比,EMO模型提供了一种免费且高效的唱歌解决方案。
广泛的视频适用性: 不仅限于写实人像,3D模型和二次元漫画风格也能生成视频,阿里满足不同用户的对口需求。
自然的型项表达: EMO模型在talking head领域首次提出weak condition(弱控制)设计,通过较弱的开启控制条件引导diffusion去噪过程,生成表情丰富、内测表现力强的照片转人脸。
技术实现:
EMO模型通过算法pipeline中的唱歌face locator和speed layers控制人脸生成区域与人头动作频率,保留了diffusion模型的生成创造能力。
模型在训练中学习音频特征与图像像素的对应关系,放大音频特征对相关像素的影响,确保人物表情口型与音频特征一致。
EMO在250小时的人物讲话视频上训练,不仅匹配了音频中具体发音与人像口型,还发现了音频中的语气特征与人物表情的关联性,将音频中的情绪色彩反映到人物微表情上。
内测链接申请地址:https://www.wjx.top/vm/exOVbr1.aspx#
项目地址:https://top.aibase.com/tool/emo
(责任编辑:资讯)
最新内容
热点内容
- ·比开车快2小时!安徽男子开小飞机带女儿回家过年
- ·5月乘用车市场零售168.5万辆:新能源占比近50%
- ·简单粗暴,日入1000+,小红书国学项目实操拆解
- ·网友发微博吐槽餐厅后被索赔9万元 法院:不予支持
- ·12306回应高铁超载:不建议买短补长 补票需要咨询列车员
- ·别养臭水了可能会得肺炎 医生:含有大量微生物和细菌
- ·幼师网购演出服 演出结束后退货 园方:幼师个人所为
- ·27% 佣金再成争议焦点,法官要求查看苹果 App Store 所有修订文件
- ·告别MIUI!Redmi Note 12 Turbo升级澎湃OS
- ·Seed-TTS功能介绍及免费使用指南 字节跳动文生语音模型体验地址入口