会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 微软开源 SliceGPT:大模型体量压缩25%左右,性能保持不变!

微软开源 SliceGPT:大模型体量压缩25%左右,性能保持不变

时间:2024-07-02 03:46:09 来源:带水拖泥网 作者:自媒体 阅读:500次

微软开源 SliceGPT:大模型体量压缩25%左右,性能保持不变

划重点:

⭐️ 可将大模型体量压缩25% 左右,微软性能保持不变。开源

⭐️ SliceGPT 利用计算不变性简化和压缩模型。大模

⭐️ 切片操作后的型体模型可以在消费级显卡上运行,无需额外代码优化。量压

CSS站长资源(ChinaZ.com)2月11日 消息:微软和苏黎世联邦理工学院的缩左研究人员联合开源了 SliceGPT,该技术可以极限压缩大模型的右性权重矩阵,将模型体量压缩25% 左右,微软同时保持性能不变。开源实验数据显示,大模在保持零样本任务性能的型体情况下,SliceGPT 成功应用于多个大型模型,量压如 LLAMA-270B、缩左OPT66B 和 Phi-2。右性

SliceGPT 的微软核心技术在于利用计算不变性来简化和压缩模型。通过对每个权重矩阵应用正交矩阵变换,SliceGPT 实现了对模型的极限压缩。此外,切片操作后的模型可以直接在消费级显卡上运行,如 N 卡的4090、4080,无需进行额外的代码优化,使得部署更加便捷。

在实验中,研究人员发现 SliceGPT 的切片技术非常简单高效,可以在几个小时内使用单个 GPU 完成模型压缩,无需复杂的细调过程。切片操作后的模型保持了高质量的生成任务性能,同时吞吐量得到提升,整体效果令人满意。

SliceGPT 的开源为压缩大模型提供了一种新颖且有效的途径,将大幅节省部署资源同时保持模型性能不变。这一技术的推出,有望为广大开发者和企业提供更加便捷、高效的大模型应用解决方案。

开源地址:https://github.com/microsoft/TransformerCompression

论文地址:https://arxiv.org/abs/2401.15024

(责任编辑:知识)

相关内容
  • 奔驰女方晒视频 奇瑞司机不是老太:奇瑞客服回应砸引擎盖定损5200元
  • 女子拍违章获奖1500被问钱烫手吗 回应:依法办事
  • 司机停车等鹅鹅们过马路 网友:想破头也不知道堵车原因是800只鹅
  • 小米史上款!小米14 Ultra支持双向卫星通信:永不断联
  • 反击战!女生寒假闯入父母房叫起床:以牙还牙
  • 腾讯视频独播!网剧《猎冰》今日开播:姚安娜搭档张颂文
  • 苹果iPhone 16 Pro将提供全新配色:沙漠钛金和钛灰色
  • OpenAI员工自曝“996”加班实锤 ChatGPT热潮下工作生活失衡
推荐内容
  • 你还会玩吗!消息称微软修复跟网易关系 暴雪国服要回归节奏
  • 员工因bug事故被要求归还年终奖 AI辅助代码助手软件有哪些?
  • 数据不实!抖音电商回应2024超3万亿元交易额目标
  • OpenAI员工自曝“996”加班实锤 ChatGPT热潮下工作生活失衡
  • 苹果发布Vision Pro耳机安全补丁 修复潜在黑客利用漏洞
  • 华为重磅产品发布会定档2月26日:首发华为通信大模型