会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 微软研究!无需训练即可融合多个Lora且保留了效果!

微软研究!无需训练即可融合多个Lora且保留了效果

时间:2024-07-02 03:22:16 来源:带水拖泥网 作者:短视频 阅读:413次

微软研究!无需训练即可融合多个Lora且保留了效果

CSS站长资源(ChinaZ.com)2月27日 消息:微软的微软无需最新研究成果在图像生成领域引起了广泛关注。他们提出了一种全新的研究文本至图像生成方法,这种方法采用了多重低秩适应(Low-Rank Adaptations,训练 LoRAs)技术,融合能够创造出高度个性化且细节丰富的且保图像。

该项目的留效特色在于其免训练方法。LoRA开关和LoRA组合支持动态精确地整合多个LoRA,微软无需无需进行微调。研究这种方法不同于那些融合LoRA权重的训练做法,而是融合专注于解码过程,并保持所有LoRA权重不变。且保这种创新的留效方法使得在生成复杂图像组合的场景中,该方法的微软无需性能显著优于现有的LoRA合并技术。

项目地址:https://maszhongming.github.io/Multi-LoRA-Composition/

此外,研究微软还推出了一个全新的训练综合性测试平台——ComposLoRA。该平台包含480套组合和22个在六大类别中预训练好的LoRA,专为评估基于LoRA的可组合图像生成任务而设计,支持定量评估。

微软还提出了采用GPT-4V作为评估工具,用以判定组合效果及图像质量。该评估工具已证实在与人类评价的相关性上有更好的表现。无论是自动化还是人类评价,微软的方法都显著优于现有的LoRA合并技术。

微软对每种方法在不同场景下的优势进行了深入的分析,并探讨了采用GPT-4V作为评估工具可能存在的偏差。这种详尽的分析为图像生成领域的研究提供了重要的参考。

总的来说,微软的这项研究成果在图像生成领域具有重要意义。他们的免训练方法、全新的测试平台以及基于GPT-4V的评估工具,都为图像生成技术的发展提供了新的思路和工具。

(责任编辑:资讯)

相关内容
  • 一个时代终结!HMD手机官宣:放弃诺基亚品牌
  • 阿里Animate Anyone体验入口 AI生成动画视频怎么使用指南教程方法
  • 语音大模型SpeechGPT-Gen:8B参数,零样本生成语音
  • 赶紧升级!苹果停止签署iOS 17.2.1:重要的错误未修复
  • 12306否认与第三方平台合作:未将票额分配给任何第三方发售
  • 春运打车需求预计上涨40% 滴滴:平台预计将发放超3亿元司机补贴
  • 男子骑电动车从江西回成都过年:边送外卖边旅游
  • Mobile-Agent官网体验入口 自主多模移动设备AI在线使用地址
推荐内容
  • 小米年度机皇预热!产品经理换上小米14 Ultra
  • 减量不减价的RTX 4090 D上市 玩家们会买账吗?
  • 阿里Animate Anyone体验入口 AI生成动画视频怎么使用指南教程方法
  • 扫一圈就是6个足球场!全球陆上叶轮风机成功吊装
  • 理想汽车 2024 年 1 月交付 31165 辆 同比增长105.8%
  • 微软等公司财报低于预期 美股AI相关巨头市值一夜蒸发1900亿美元