会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 EMO在哪体验?阿里对口型视频生成工具EMO下载地址!

EMO在哪体验?阿里对口型视频生成工具EMO下载地址

时间:2024-07-04 04:34:17 来源:带水拖泥网 作者:自媒体 阅读:887次

EMO在哪体验?阿里对口型视频生成工具EMO下载地址

这几天,口型阿里的视频生成对口型视频生成工具EMO火了。根据官方宣传,工具EMO只需要上传一张图片和一段音频就可以一键生成对口型视频,载地址而且视频中的口型嘴型还可以与声音匹配。这项技术支持多语言、视频生成对话、工具唱歌以及快速语速的载地址适配,但也可能成为制造虚假视频的口型利器,因此一些名人可能需要警惕了。视频生成(EMO下载地址见文末)

工作原理:

该框架包含两个主要阶段,工具首先是载地址帧编码阶段,利用ReferenceNet从参考图像和动作帧中提取特征;

其次是口型扩散过程阶段,通过预训练的视频生成音频编码器处理声音嵌入,并结合多帧噪声和面部区域掩码来生成头像。工具在此过程中,采用了两种注意机制(参考注意和音频注意)和时间模块,以保持角色身份并调节运动速度。

EMO不仅支持多语言歌曲和不同风格的头像生成,还可以处理歌唱、对话等不同场景。它能够根据输入音频的长度生成不同时长的视频,并保持角色的身份特征在长时间内的稳定性。此外,EMO还展示了在快节奏音乐中保持与音频同步的能力,确保角色动画的表现力和动态性。

这一研究对于头像视频生成领域具有重要意义,为多语言、多样化场景下的角色表现提供了新的可能性。它不仅可以应用于娱乐产业,还可以在学术研究和教育培训等领域发挥重要作用。然而,需要注意的是,该框架目前仅用于学术研究和效果演示,还有待进一步优化和扩展其应用范围。

EMO下载地址:https://humanaigc.github.io/emote-portrait-alive/

注意:目前官方只公布了项目演示和代码,试玩地址还未上线,请耐心等待~

(责任编辑:电商)

相关内容
  • 决战拜年之巅怎么玩 决战拜年之巅入口在哪?
  • 比特币突破71000美元 刷新历史纪录
  • 从骁龙X80到AI Hub软硬全布局 高通开启万物智能时代
  • 运气爆棚!00后女孩次买刮刮乐就中了100万
  • AI视野:谷歌推小模型MobileDiffusion;Midjourney测试风格一致性功能;字节跳动推AI Bot开发平台扣子;LLaVA-1.6赶超Gemini Pro
  • 微软被打工人“吐槽”!只因改了个默认字体
  • 游戏人入局、资本疯抢,谁会是下一个AI独角兽?
  • Midjourney发布角色一致性功能:定制角色图像与参照图像相符合
推荐内容
  • 捕捞出售违法!比利时设陷阱诱捕300万只大闸蟹:破坏河道威胁生态 老外不吃
  • 《射雕英雄传》线下展台海报首曝:徐克执导 肖战出演!
  • 游戏人入局、资本疯抢,谁会是下一个AI独角兽?
  • 专家科普手机等电子产品“护眼模式”能否保护视力:有用 但不多
  • 泰国小镇被3500只猴子占据 昔日繁荣已荡然无存
  • 研究:在家做顿饭等于吸20分钟汽车尾气