会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 阿里对口型项目EMO开启内测 可将照片转为唱歌视频!

阿里对口型项目EMO开启内测 可将照片转为唱歌视频

时间:2024-07-04 04:32:55 来源:带水拖泥网 作者:小程序 阅读:206次

阿里对口型项目EMO开启内测 可将照片转为唱歌视频

CSS站长资源(ChinaZ.com)4月25日 消息:千呼万唤始出来!阿里对口型项目EMO终于开启内测了。阿里它能够将一张简单的对口照片转化为唱歌视频,为用户提供了一种全新的型项数字人出镜体验。

EMO模型的开启特点:

简便的操作: 用户只需提供一张照片和克隆的语音模型,即可定制自己的内测数字人像。

低成本: 与Heygen等需要录制长视频和高算力成本的照片转产品相比,EMO模型提供了一种免费且高效的唱歌解决方案。

广泛的视频适用性: 不仅限于写实人像,3D模型和二次元漫画风格也能生成视频,阿里满足不同用户的对口需求。

自然的型项表达: EMO模型在talking head领域首次提出weak condition(弱控制)设计,通过较弱的开启控制条件引导diffusion去噪过程,生成表情丰富、内测表现力强的照片转人脸。

技术实现:

EMO模型通过算法pipeline中的唱歌face locator和speed layers控制人脸生成区域与人头动作频率,保留了diffusion模型的生成创造能力。

模型在训练中学习音频特征与图像像素的对应关系,放大音频特征对相关像素的影响,确保人物表情口型与音频特征一致。

EMO在250小时的人物讲话视频上训练,不仅匹配了音频中具体发音与人像口型,还发现了音频中的语气特征与人物表情的关联性,将音频中的情绪色彩反映到人物微表情上。

内测链接申请地址:https://www.wjx.top/vm/exOVbr1.aspx#

项目地址:https://top.aibase.com/tool/emo

(责任编辑:资讯)

相关内容
  • 驴妈妈回应解散 AI人工智能「旅游」应用有哪些?
  • 问一问给你分钱了
  • 平均每部手机安装了80个App 常用仅9个:体积越来越大 微信11年膨胀575倍
  • 自媒体无底线博流量 微信出手:近千个账号被禁言、封号等
  • IBM研究发现:​ AI语音克隆可劫持合法通话进行诈骗
  • iPhone 16 Pro将配48MP超广角摄像头 功能按键改为Action Button
  • 字节推语音生成模型Seed-TTS 擅长感情控制,声音与真人无异
  • 问界M9遥控泊车正式上线:支持手机APP远程操控
推荐内容
  • 小米汽车SU7首撞产生:雪天路滑、大灯被撞瞎
  • 问一问给你分钱了
  • ChatGPT近8小时大规模宕机 平替谷歌Gemini 搜索量飙升60%
  • 女子订酒店打开窗就能看到火车站台:仿佛就住在车站之上
  • InstructIR:可按照人类指令进行高质量图像修复
  • 魔兽世界国服战网重新上线:玩家交易数据确认保留