中山大学等提出ScaleLong扩散模型 scaling操作可以稳定模型训练
要点:
1. UNet的中山作long skip connection上的scaling操作可以稳定模型训练。
2. Scaling系数的大学等提设置影响模型性能,可以通过学习或固定的出Sg操方式实现。
3. 对扩散模型任务在训练过程中特征和参数的扩散可视化有助于理解模型稳定性。
CSS站长资源(ChinaZ.com)3月1日 消息:扩散模型中,模型模型UNet的稳定long skip connection上的scaling操作被证实能够稳定模型训练。在一些流行的训练扩散模型中,如Imagen和Score-based generative model中,中山作已经观察到设置scaling系数可以有效加速模型的大学等提训练过程。
但是出Sg操,过去这种操作缺乏具体的扩散分析,只是模型模型经验性地认为能够起到加速作用。现有研究发现,稳定合理设置scaling系数可以缓解特征不稳定,训练进而提高模型对输入扰动的中山作鲁棒性。
项目地址:https://github.com/sail-sg/ScaleLong
这项研究也揭示了scaling系数对梯度量级的控制以及对输入扰动的稳定性的影响。通过对扩散模型任务中特征和参数的可视化,研究人员发现了模型训练过程中的不稳定现象,这一发现促使他们在long skip connection上进行Scaling来进行统一地缓解。
通过引入可学习的模块,如Learnable Scaling (LS) Method,可以自适应地调整scaling系数,进一步稳定模型的训练。
此外,研究人员提出了一种无需额外参数的Constant Scaling (CS) Method,简化了模型实现过程。虽然LS在稳定训练上表现更好,但CS仍然是一种值得尝试的策略。这些方法的实现非常简洁,只需几行代码即可实现。最近的一些后续工作也进一步验证了skip connection上scaling的重要性,为这一领域的发展提供了新的思路和方向。
(责任编辑:自媒体)
- ·开源AI拯救Meta一夜飙升1960亿刀,39岁小扎爬出元宇宙深坑!年分红7个亿,靠Llama赢麻了
- ·传闻“2亿年终奖是G3手机” 格力官方发声:手机是额外免费送的
- ·大熊猫性感抖臀致直播间被封十分钟 工作人员:非正常表现
- ·驴妈妈回应解散:流动资金困难 正在积极解决
- ·谷歌产品大更新:Bard可生成图像;文生音乐平台等5大免费功能
- ·AI智能剪辑软件AIMIX 支持短视频批量混剪、文案、字幕生成、语音合成等
- ·全球!三星Galaxy S24 Ultra DXO屏幕得分155分:碾压iPhone 15 Pro Max
- ·Photo Factory官网体验入口 人工智能AI肖像生成服务平台在线使用地址
- ·苹果折叠屏产品有望在2026-2027年推出 或取代iPad mini
- ·涨粉300万!90后讲师何楚涵,边讲课边玩短视频,仅半年成为“最会讲故事的女博士”
- ·春节穿汉服可免费乘苏州地铁 苏州轨道交通推出春节免费乘车活动
- ·奇瑞回应徐奶奶车被奔驰男砸:我们的车主奶奶我们自己宠 已送新车瑞虎9代步
- ·年货节要换手机的注意了!一加12有限时好礼送
- ·车厘子打败砂糖橘成年货顶流:价格持续下降 春节期间销量大增
- ·超小米荣耀!华为HarmonyOS 4无障碍适配获五星评分
- ·网友吐槽服务区充电桩比加油贵 2.98元/度电:官方回应了
- ·网友吐槽服务区充电桩比加油贵 官方:从未改价 已上报
- ·AutoMathText体验入口 数学内容的AI模型数据集免费在线下载地址
- ·医疗博主发布女性隆胸视频被处罚:已删除相关视频
- ·多地暴雪、冻雨!申通快递对12省份快件提价:3公斤以上单价上涨