谷歌推出ASPIRE框架 让大模型具备自我判断意识
CSS站长资源(ChinaZ.com)2月7日 消息:谷歌最近推出了一项名为ASPIRE的谷歌自适应评估框架,旨在帮助大型语言模型在面对置信度较低的推出样本时做出正确的判断。这个框架的框架核心技术思路是基于自我评估的选择性预测,通过任务定向微调、模型答案采样和自我评估学习三大模块来实现。具备
论文地址:https://aclanthology.org/2023.findings-emnlp.345.pdf?自判ref=maginative.com
具体来说,任务定向微调能够通过使用目标任务的断意训练数据对模型进行微调,提高其在特定任务上的谷歌性能。答案采样则可以生成多个候选答案,推出并评估其概率分布,框架以帮助模型判断答案的模型可靠性。自我评估学习则通过学习自我评估能力,具备让模型能够更好地区分正确和错误答案,自判从而提高选择性预测性能。断意
实验数据显示,谷歌ASPIRE在不同数据集上均表现出了良好的性能。例如,在CoQA数据集上,ASPIRE框架将答案的准确性提升了,并且能够减少错误答案的生成;在TriviaQA数据集上,通过设置选择性分数阈值,ASPIRE能够更准确地判断出哪些问题的答案不可靠,从而避免生成错误答案;在Natural Questions数据集上,ASPIRE成功降低了错误答案的比例,提高了答案的质量。这些实验证明了ASPIRE框架的高效性和可行性,为大型语言模型的应用提供了重要的支持和保障。
ASPIRE框架的推出填补了大型语言模型在置信度校准方面的空白,为其在实际应用中的稳定性和准确性提供了有力保障。随着这一框架的不断完善和应用,相信大型语言模型在各个领域的表现将会更加出色,为人们带来更好的体验和服务。
(责任编辑:深度)
- ·奇瑞回应徐奶奶车被奔驰男砸:我们的车主奶奶我们自己宠 已送新车瑞虎9代步
- ·海南出岛机票紧张、票价超万元 官方回应:建议避免从三亚直飞
- ·78.44亿票房创影史新高!春节档8部电影一半都撤档了 打工人:我也退出春节档了
- ·不到30万!理想L6官方预告图正式发布:4月有望上市
- ·库克回应苹果开放侧载:违背“祖训”无法限度保护隐私
- ·六公主评盗摄争议:龙标一出就不能再对着电影屏幕拍摄了
- ·阿里巴巴2023年员工减少约2万人:缩减幅度近1/10!
- ·龙年首场寒潮即将突入我国 新疆跳崖式下跌30℃
- ·教你用AI制作微信红包封面,分分钟躺赚千元(附红包封面)
- ·2024春节档票房破60亿:《热辣滚烫》《飞驰人生2》 这部电影突然宣布退出
- ·iPhone销量不佳!苹果公布2024财年季度营收报告
- ·Sora模型体验入口 OpenAI文生视频软件工具app免费下载地址
- ·周鸿祎谈Sora视频模型:中美的AI差距还在加大
- ·必须升!Windows 11 24H2六大重磅新功能首曝:基于新一代Windows平台打造
- ·奔驰女方晒视频 奇瑞司机不是老太:奇瑞客服回应砸引擎盖定损5200元
- ·一企业给提前返岗员工奖励3000元:70%的都回来了
- ·农村老人沉迷刷APP挣钱:上网7小时每天挣2块钱
- ·苹果停止签署iOS17.3:已升级用户无法降级
- ·女子兑200元中奖彩票被店员撕毁 长春体彩通报:停机整顿
- ·Sora官网体验入口 OpenAI文生视频模型免费在线使用地址