清华、哈工大提出OneBit方法:可把大模型压缩到1bit 保持 83% 性能
划重点:
⭐ 清华大学和哈尔滨工业大学联合发布论文,清将大模型压缩到1bit,华哈保持83% 性能;
⭐ OneBit 方法首次尝试1bit 量化,提出突破了2bit 的可把限制;
⭐ 新方法结合1bit 层结构、基于 SVID 的大模参数初始化和量化感知训练。
CSS站长资源(ChinaZ.com)3月4日 消息:近期,型压清华大学和哈尔滨工业大学联合发布了一篇论文,持性成功将大模型压缩到1bit,清仍保持83% 的华哈性能。这一成果标志着量化模型领域的提出一次重大突破。过去,可把2bit 以下的大模量化一直是研究人员难以逾越的障碍,而这次的型压1bit 量化尝试,引起了国内外学术界的持性广泛关注。
这项研究提出的清 OneBit 方法,首次尝试将预训练大模型压缩到真正的1bit。通过全新的1bit 层结构、基于 SVID 的参数初始化和量化感知训练,成功将大模型参数压缩到1bit 表示。该方法不仅保留了模型的高精度和高秩,还能够在极大幅度压缩模型参数的同时,保证模型至少83% 的性能。
OneBit 方法的核心在于将权重矩阵压缩到1bit,并引入两个 FP16格式的值向量以弥补精度损失。通过新的参数初始化方法 SVID 和知识迁移,成功将高精度预训练模型的能力转移到1bit 量化模型上。实验结果表明,OneBit 方法相较于其他2bit 量化方法,在验证集困惑度和 Zero-shot 准确度上表现更为优秀。
该研究的意义在于,成功突破了2bit 量化的障碍,为在 PC 和智能手机上部署大模型提供了新的可能性。未来,随着技术的不断进步,将有望实现将大型语言模型等大模型压缩到极低位宽,并实现在移动设备上高效运行的愿景。
论文地址:https://arxiv.org/pdf/2402.11295.pdf
(责任编辑:热点)
- ·2024大模型应用元年,科大讯飞率先打响商业化枪
- ·AI日报:PR重大更新!Sora加入Adobe全家桶;文心大模型4.0工具版发布;世界首届AI选美大赛开始;GPT-4整顿学术圈
- ·抖音AI聊天豆包体验地址 字节豆包聊天机器人app下载
- ·雷军:小米SU7订单远超最乐观预期 霞光紫成最火颜色
- ·网友吐槽服务区充电桩比加油贵 2.98元/度电:官方回应了
- ·文心一言用户数突破2亿!文心大模型4.0工具版正式发布
- ·moto G64 5G正式发布:搭载120Hz刷新率和6000mAh大电池
- ·SuperMemory官网体验入口 AI知识管理信息整理工具免费使用地址
- ·华为完成国内千小区连片开通5.5G 实测网速超4000Mbps
- ·百度发布新一代智能计算操作系统!定名万源
- ·中石油官方提醒:“移动加油站”的油千万别加!不合格伤车
- ·暴雪游戏国服今夏回归!官方解答帐号忘记、登不上关键问题
- ·50万内量产车没对手!博主实测小米SU7零百加速2.95秒:最快
- ·李飞飞团队年度报告揭底大模型训练成本:Gemini Ultra是GPT-4的2.5倍
- ·58岁大叔骑摩托载妻返乡:更舒适 更自由
- ·武汉凌晨现红色大雾 气象台:可能为红色光源照射产生
- ·外挂变焦环!刘作虎秀出OPPO Find X7 Ultra概念版
- ·京东“京享值”升级为“会员等级”:每月25日定级
- ·苹果财季中国收入下降13% 库克回应:仍是热销产品
- ·SuperMemory官网体验入口 AI知识管理信息整理工具免费使用地址