AI 框架Ambient Diffusion:从图像中获取灵感,而非复制
划重点:
🔍 德克萨斯大学奥斯汀分校的而非复制研究队开发了一种框架,通过对无法辨认的框架图像进行训练,来训练 AI 模型。从图
📝 这一新提出的像中框架名为 Ambient Diffusion,它通过仅训练扰乱后的灵感图像数据,绕过了这个问题。而非复制
💡 这一框架不仅对艺术领域有用,框架还有潜力应用于科学和医学领域,从图如黑洞成像和某些 MRI 扫描。像中
CSS站长资源(ChinaZ.com)5月21日 消息:强大的灵感人工智能模型有时会出现错误,包括虚构错误信息或将他人作品作为自己的而非复制。为了解决后者的框架问题,德克萨斯大学奥斯汀分校的从图研究团队开发了一种名为 "Ambient Diffusion" 的框架。该框架通过对无法辨认的像中图像数据进行训练,绕过了 AI 模型复制他人作品的灵感问题。
DALL-E、Midjourney 和 Stable Diffusion 是文本到图像扩散生成的人工智能模型,它们能够将任意用户文本转化为高度逼真的图像。这三个模型都面临着艺术家提起诉讼的问题,他们声称生成的样本复制他们的作品。这些模型是通过训练数十亿个图像 - 文本对来实现的,这些对外不公开,它们能够生成高质量的图像,但可能会使用版权图像并复制它们。
"Ambient Diffusion" 框架的提出解决了这个问题,通过仅通过扰乱后的图像数据对扩散模型进行训练。初步实验表明,该框架仍然能够生成高质量的样本,而不需要看到任何可识别为原始源图像的内容。研究团队首先在一组3000张名人图片上训练了一个扩散模型,然后使用该模型生成了新的样本。
在实验中,用清晰的数据训练的扩散模型明显复制了训练样本。但当研究人员对训练数据进行扰乱,随机遮挡图像中的个别像素,然后用新的方法对模型进行重新训练时,生成的样本保持了高质量,但看起来完全不同。该模型仍然可以生成人脸,但生成的人脸与训练图像有明显的区别。
研究人员表示,这指向了一个解决方案,尽管可能会改变性能,但永远不会输出噪声。这一框架为学术研究人员如何推进人工智能以满足社会需求提供了一个示例。德克萨斯大学奥斯汀分校已将2024年宣布为 "AI 之年",这是今年的一个关键主题。该研究团队还包括加州大学伯克利分校和麻省理工学院的成员。
论文:https://arxiv.org/abs/2305.19256
关联项目:https://github.com/giannisdaras/ambient-tweedie?tab=readme-ov-file
(责任编辑:短视频)
- ·Redmi Note 12 Turbo更新澎湃OS后爆火:酷安热度冲上名
- ·彩票中946万 卖烤鸡腿表兄弟反目 网友:人性的复杂性
- ·doge表情包柴犬去世:享年18岁 睡梦中安详离世
- ·阿里投资Kimi AI开发商月之暗面细节曝光:8亿美元换36%股权
- ·“Linux 中国” 开源社区宣布停止运营
- ·包下公务机去极氪探厂!周鸿祎:是为了体现对同行的重视
- ·通义灵码功能介绍及免费使用指南 编码助手体验地址入口
- ·阿里投资Kimi AI开发商月之暗面细节曝光:8亿美元换36%股权
- ·Allen人工智能研究所推开源模型LLM OLMo 提供模型数据、训练代码等
- ·蓝领岗位成为更多毕业生的选择 不再执着于办公室岗位
- ·活了这么久 次见高铁10码速度缓慢行驶
- ·出现癌前病变就离患癌症不远吗:假的
- ·小米13系列相册升级:新增智能扩图、魔法消除Pro功能
- ·苹果要淘汰LCD!曝供应链已为iPad mini开发OLED面板
- ·高铁超载无法运行 有旅客被请下车!12306回应:不建议买短补长
- ·Spotify推出西语版AI DJ“DJ Livi” 开启个性化音乐体验新纪元
- ·Spotify推出西语版AI DJ“DJ Livi” 开启个性化音乐体验新纪元
- ·AI日报:效果炸裂!Krea Video向所有人开放;阿里花8亿入股Kimi;Arc Search可以打电话了;腾讯智影声音大模型升级
- ·景区公厕需扫码才能进?游客傻眼 官方回应:将协商改进
- ·方程豹豹5百公里18升油后续 比亚迪法务部:起诉当事人索赔500万