会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 EMO同款?谷歌推对口型视频工具VLOGGER 还具备视频编辑功能!

EMO同款?谷歌推对口型视频工具VLOGGER 还具备视频编辑功能

时间:2024-07-02 04:12:52 来源:带水拖泥网 作者:深度 阅读:420次

EMO同款?谷歌推对口型视频工具VLOGGER 还具备视频编辑功能

CSS站长资源(ChinaZ.com) 3月14日 消息:科技巨头们正在竞相开发能够从单张照片生成会说话的款谷人类视频的技术。继阿里巴巴推出其EMO项目后,歌推Google也推出了类似的对口项目VLOGGER。这项技术基于文本和驱动音频,型视能够从单张照片生成会说话的频工频编人类视频。

项目地址:https://top.aibase.com/tool/vlogger

论文地址:https://arxiv.org/pdf/2403.08764.pdf

VLOGGER的具V辑功独特之处在于:

  • 不需要针对每个人进行训练。这意味着无需为每个个体创建专门的还具模型,大大降低了数据需求。备视

  • 不依赖于面部检测和修剪。款谷这使得VLOGGER能够在没有清晰的歌推面部轮廓或面部特征的情况下工作。

  • 生成完整的对口图像(而不仅仅是面部或嘴唇)。这为生成更自然、型视更真实的频工频编视频提供了可能。

  • 考虑了一系列广泛的具V辑功场景(例如,可见的还具躯干或多样化的身份特征),这对于正确合成交流的人类至关重要。

  • 然而,尽管VLOGGER在技术上有其独特之处,但根据演示视频来看,其效果似乎不如阿里巴巴的EMO好。这可能是由于EMO在面部表情和动作的合成上更为精细。

除了生成新的视频,VLOGGER还具有编辑现有视频的能力。例如,它可以改变主题的表情,或者调整嘴巴和眼睛的闭合状态,从而改变视频的情绪和信息传递。

在视频翻译方面,VLOGGER也可以取一个特定语言的现有视频,并编辑唇部和面部区域以适应新的音频。例如,可以将一段英语视频的唇部和面部区域编辑,使其看起来像是在说西班牙语。

总的来说,VLOGGER是Google在人工智能领域的又一重要突破,它展示了从单张照片生成会说话的人类视频的可能性,同时也提供了视频编辑和翻译的新工具。然而,与阿里巴巴的EMO相比,VLOGGER在视频生成的效果上还有待提升。

(责任编辑:自媒体)

相关内容
  • 从上海回贵州开车开了三天还没到 女子春节回家历经风雨雪雾
  • Shopify发布“Magic”图像编辑器等AI增强功能,助力商家智能经营
  • 微信输入法1.2.2正式版iOS/安卓双更新!剪贴板、方言语音输入来了
  • 女子发愁春节红包:我1个娃对方3个 专家:发红包应与收入匹配
  • 你的城市有这素质吗:杭州斑马线前礼让行人感动外地游客 特别好的城市
  • 字节跳动推“Coze 扣子”AI Bot 开发平台 用户可搭建自己的聊天机器人
  • 「.ai」域名每月能为安圭拉带来约300万美元的收入
  • 智心云言体验入口 AI智能对话与绘画工具在线使用地址
推荐内容
  • 美邦创始人:亏损责任不在我女儿 自己将全面参与经营
  • 因谷歌业绩低迷,AI相关公司市值损失1900亿美元
  • 字节跳动推“Coze 扣子”AI Bot 开发平台 用户可搭建自己的聊天机器人
  • 五角大楼启动2.4万元AI赏金计划,寻找偏见证据
  • 京东春晚互动大奖揭晓:100寸电视、2万元洗衣机只要1分钱
  • 涨粉300万!90后讲师何楚涵,边讲课边玩短视频,仅半年成为“最会讲故事的女博士”