会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 Meta 发布新多token预测技术,使AI模型速度提升3倍!

Meta 发布新多token预测技术,使AI模型速度提升3倍

时间:2024-07-02 03:43:15 来源:带水拖泥网 作者:热点 阅读:238次

Meta 发布新多token预测技术,使AI模型速度提升3倍

划重点:

⭐ 研究人员在 Meta、发布Ecole des Ponts ParisTech 和 Université Paris-Saclay 的新多一项研究中提出了通过同时预测多个token来改进 AI 大型语言模型(LLMs)的准确性和速度。

⭐ 多token预测使模型在推理时间上提升了3倍,测技并在生成任务上表现更佳,术使速度特别是模型对于长期模式的学习。

⭐ 这项研究为企业应用提供了更快的提升推理速度和更高的准确性,特别适用于生成任务,发布同时与 Transformer 块的新多其他优化技术兼容。

CSS站长资源(ChinaZ.com) 5月7日 消息:近期,测技Meta、术使速度Ecole des Ponts ParisTech 和 Université Paris-Saclay 的模型研究人员在一项研究中提出了一种改进 AI 大型语言模型(LLMs)准确性和速度的方法,即通过同时预测多个token。提升这与自回归语言模型的发布经典结构相悖,后者旨在一次预测一个token。新多

然而,测技多token预测并非适用于所有类型的模型和语言任务,但在某些领域中提供了重大优势,推理速度提升了3倍,并在生成任务上表现更佳。虽然仍有改进空间,但这项技术可能成为某些 LLM 应用的强大工具。

传统的训练 LLMs 的方法被称为 “下一个token预测”,这是一种自监督学习技术,模型被给定一个token序列,必须预测下一个token。然后将预测的token添加到输入中,重复这个过程,一次预测一个token。在大量文本语料上重复此过程,模型学习了允许它输出连贯文本段落的一般模式。

研究人员已经研究并记录了下一个token预测在获取语言、世界知识和推理能力方面的局限性。新研究的假设是 “训练语言模型同时预测多个未来token会导致更高的样本效率”。

多token预测指示 LLM 同时预测训练语料库中每个位置的多个来token。研究人员提出了一个简单的多token预测架构,不需要额外的训练时间或内存开销。

他们在多种任务上测试了新的多token预测方案,发现在小型模型上,多token预测导更差的结果,但随着模型规模的增加,它变得越来越有用。此外,多token预测还使模型在推理时间上提升了3倍,尤其在 “字节级标记化” 训练上,多字节预测大幅优于基线的单字节预测模型。多token预测仍有改进空间,研究人员正在考虑自动选择最佳预测token数量的技术,以及研究词汇量和多token预测之间的动态关系。

这项研究及其未来的改进对企业应用有用的地方在于,它有可能为生成任务提供更快的推理和更高的准性,几乎不需要额外的成本。同时,它保留了大部分 LLM 架构,可以与 Transformer 块的其他优化技术兼容。

(责任编辑:业界)

相关内容
  • 小米竖折旗舰!小米MIX Flip搭载国产屏:创新零感折痕技术
  • Kimi连续宕机打醒巨头,阿里百度360连夜出手长文本,大模型商业化厮杀开始了
  • 飞书CEO宣布裁员 因组织不够精干效率变低
  • 真我GT Neo6 SE来了 徐起:拥有4000以内的手机屏幕 不服来战
  • BiTA:创新AI方法加速大型语言模型生成
  • 曝小米汽车与京东汽车深度合作:覆盖售前、售后多项服务
  • 马斯克要求特斯拉北美交车时必须带客户体验FSD自动驾驶
  • 50万粉丝带动1700万GMV,B站服饰赛道起风了
推荐内容
  • 女子买4只螃蟹花289元 市监局回应:捆绑过度可举报
  • 胖东来招聘209人:收3.16万份简历
  • 太阳发了个脾气:漠河出现极光
  • 太阳发了个脾气:漠河出现极光
  • 爽翻!小伙挂临牌19分钟内闯8个红灯 记48分罚款1200元:官方科普临牌意义
  • 时隔六年!特斯拉重新创建Facebook账号