思维链被推翻!纽约大学新研究:大模型推理步骤或可省略
CSS站长资源(ChinaZ.com)5月15日 消息:纽约大学的思维省略最新研究对当前流行的思维链(Chain-of-Thought,CoT)技术提出了挑战,链被该技术原本被认为能够提升大模型的推翻推理推理能力。研究显示,纽约使用省略号代替具体的大学推理步骤,模型的新研推理结果并没有显著差异,这意味着增加计算量而非推理步骤本身可能是模型提升性能的关键。
论文地址:https://arxiv.org/pdf/2404.15758
研究要点
省略号代替推理步骤:研究发现,步骤将思维链推理中的思维省略具体步骤替换为省略号(...),模型的链被推理结果与完整步骤的推理结果相差无几。
性能提升来源:实验结果表明,推翻推理所谓的纽约性能提升可能只是因为大模型获得了更多的计算资源(token数量),而非真正的大学推理步骤。
隐藏推理:该发现还引发了关于模型可能在不可见的新研情况下进行隐藏推理的讨论,这在一定程度上脱离了人类的模型控制。
实验设计
3SUM问题:设计了一个难度较高的3SUM问题,要求模型在序列中挑选满足条件的3个数,实验中使用了填充token的方法,并与CoT解决方案进行对比。
2SUM-Transform任务:第二个任务是2SUM-Transform,通过将输入数字进行随机偏移,防止模型直接计算,实验结果显示填充token的方法精度接近CoT。
研究结论
填充token的有效性:研究表明,使用重复的省略号作为填充token可以达到与CoT相似的效果。
局限性:尽管填充token方法有效,但它并没有突破Transformer的计算复杂度上限,且需要特定的训练过程。
这项研究为AI领域带来了新的视角,提示我们在设计和使用大型语言模型时,需要更深入地理解其工作原理和性能提升的真正来源。同时,也引发了关于AI安全性和未来发展的进一步思考。
(责任编辑:小程序)
- ·河南鹅毛大雪满天飞 积雪脚脖子深:专家提醒安全出行
- ·B站UP主让AI修习春山学 视频播放量近200万
- ·YOLOv8官网体验入口 AI计算机视觉目标检测模型免费在线使用地址
- ·OpenAI竞争对手Anthropic又获7.5亿美元投资
- ·大熊猫性感抖臀致直播间被封十分钟 工作人员:非正常表现
- ·一季度营收221亿美元!英伟达送新财报:黄仁勋赚麻 股价暴涨10%
- ·春晚60万大奖得主现身 因反诈意识强险错失华为全家桶
- ·小米史上款!小米14 Ultra支持双向卫星通信:永不断联
- ·中国航天又破新纪录!西昌发射场最短时间实现200次发射
- ·河马爱学体验入口 AI智能教育学习助手软件app免费下载地址
- ·申通快递对12省份快件提价 以应对恶劣天气
- ·小米澎湃T1信号增强芯片来了:通信性能提升37% 小米14 Ultra首搭两颗
- ·B站UP主让AI修习春山学 视频播放量近200万
- ·卢伟冰:小米14 Ultra率先搭载全新科纳皮 耐磨性超上代6倍
- ·生肖属龙或姓龙游客可免费游龙游 龙游县推出2024春节系列活动
- ·小米14 Ultra亮屏照曝光 网友直呼“YYDS”
- ·专家建议取消中考给孩子减压:直接普及高中 中学念5年
- ·就等卢伟冰公布价格了!网友已下单小米14 Ultra手机壳
- ·复刻动漫“神器”,@剑客范十三 守护万千网友的英雄梦
- ·小米14 Ultra发布会有新面孔登台 卢伟冰:老米粉看到照片一定不陌生