会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 ​英伟达推文生图模型 ConsiStory:免训练、可生成连贯图片!

​英伟达推文生图模型 ConsiStory:免训练、可生成连贯图片

时间:2024-07-02 04:15:26 来源:带水拖泥网 作者:业界 阅读:291次

​英伟达推文生图模型 ConsiStory:免训练、可生成连贯图片

划重点:

⭐️ 英伟达和特拉维夫大学研究人员共同开发了一种免训练、​英可生成连贯图片的伟达文生图模型 ConsiStory。

⭐️ ConsiStory 通过主体驱动自注意力(SDSA)和特征注入等核心模块,推文图片在不需要任何训练或调优的生图生成情况下实现图像主体的一致性。

⭐️ 该模型还包含锚图像和可重用主体功能,模型免训提供主题一致性的练可连贯参考,避免了传统训练方法中针对每个主题进行训练的​英难题。

CSS站长资源(ChinaZ.com) 2月21日 消息:英伟达与特拉维夫大学的伟达研究人员联手开发了一款名为 ConsiStory 的文生图模型(目前尚未开源),旨在解决目前文生图模型在生成内容一致性方面的推文图片挑战。

ConsiStory 采用了一种全新的生图生成方法,通过主体驱动自注意力(SDSA)和特征注入等核心模块,模型免训实现了图像主体的练可连贯一致性,无需任何训练或调优。​英

SDSA 模块是伟达 ConsiStory 的核心之一,扩大了扩散模型中自注意力层,推文图片允许不同图像中的主体保持一致的外观。通过主体蒙版遮蔽背景区域的敏感信息,不同图像中的主体可以相互 "对齐",保持一致性。而特征注入则建立在扩散特征空间的密集对应图上,确保主体相关的纹理、颜色等细节特征在整个批次中互相 "对齐",进一步增强了主体间的一致性。

此外,ConsiStory 还提供了锚图像和可重用主体功能,锚图像作为主题信息的参考,引导图像生成过程以保持一致性。可重用主体则通过共享预训练模型的内部激活,避免了传统方法中针对每个主题进行训练的难题,实现了0训练成本。这些功能共同助力 ConsiStory 成为一款无需训练即可生成连贯图片的文生图模型,为 AI 图像生成领域带来了新的可能性。

论文地址:https://arxiv.org/abs/2402.03286

(责任编辑:知识)

相关内容
  • 小米竖折旗舰!小米MIX Flip搭载国产屏:创新零感折痕技术
  • 娃哈哈妇女节放半天假加100元餐补 网友点赞:值得学习
  • Meta投资人工智能推动视频推荐 融合Feed和Reels
  • Civi!曝小米Civi 4搭载骁龙8S Gen3
  • 文心一言APP一键生成专属数字分身 iOS和Android用户免费用
  • 女儿偷回家做满桌菜妈妈以为进错门:反复确认才进门
  • 看90分钟恐怖片相当于步行30分钟!心跳速度与热量消耗有关
  • 点评14个热门的搞钱项目
推荐内容
  • 路面结冰小哥带哈士奇送外卖 网友:勇敢狗狗不怕困难
  • 被AI吞噬的“AI三杰”
  • 平板预定!vivo Pad3 Pro详细参数曝光:天玑9300 3K 144Hz屏
  • 委员建议国家全面禁止未成年人网游:许多孩子无法自控
  • 库克宣布全新人工智能功能今年发布!iOS 18将迎苹果史上升级
  • 联想控股原董事长曾茂朝因病去世:享年92岁