会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 谷歌推出ASPIRE框架 让大模型具备自我判断意识!

谷歌推出ASPIRE框架 让大模型具备自我判断意识

时间:2024-06-30 00:06:24 来源:带水拖泥网 作者:资讯 阅读:148次

谷歌推出ASPIRE框架 让大模型具备自我判断意识

CSS站长资源(ChinaZ.com)2月7日 消息:谷歌最近推出了一项名为ASPIRE的谷歌自适应评估框架,旨在帮助大型语言模型在面对置信度较低的推出样本时做出正确的判断。这个框架的框架核心技术思路是基于自我评估的选择性预测,通过任务定向微调、模型答案采样和自我评估学习三大模块来实现。具备

论文地址:https://aclanthology.org/2023.findings-emnlp.345.pdf?自判ref=maginative.com

具体来说,任务定向微调能够通过使用目标任务的断意训练数据对模型进行微调,提高其在特定任务上的谷歌性能。答案采样则可以生成多个候选答案,推出并评估其概率分布,框架以帮助模型判断答案的模型可靠性。自我评估学习则通过学习自我评估能力,具备让模型能够更好地区分正确和错误答案,自判从而提高选择性预测性能。断意

实验数据显示,谷歌ASPIRE在不同数据集上均表现出了良好的性能。例如,在CoQA数据集上,ASPIRE框架将答案的准确性提升了,并且能够减少错误答案的生成;在TriviaQA数据集上,通过设置选择性分数阈值,ASPIRE能够更准确地判断出哪些问题的答案不可靠,从而避免生成错误答案;在Natural Questions数据集上,ASPIRE成功降低了错误答案的比例,提高了答案的质量。这些实验证明了ASPIRE框架的高效性和可行性,为大型语言模型的应用提供了重要的支持和保障。

ASPIRE框架的推出填补了大型语言模型在置信度校准方面的空白,为其在实际应用中的稳定性和准确性提供了有力保障。随着这一框架的不断完善和应用,相信大型语言模型在各个领域的表现将会更加出色,为人们带来更好的体验和服务。

(责任编辑:深度)

相关内容
  • 直逼GPT-4开源模型大泄漏,AI社区炸锅!Mistral CEO自曝是旧模型,OpenAI再败一局?
  • 苹果 iPhone 16 Pro 系列相机设计重大改变
  • 龙年首场寒潮即将突入我国 新疆跳崖式下跌30℃
  • 拿货靠抢!义乌“年画大王”卖全球
  • 抖音开展春节内容治理 打击散播网络戾气等不当内容
  • 英伟达黄仁勋:必须学计算机的时代过去了 人类生物学才是未来
  • 春晚埋下的梗,我在小红书里读懂了
  • 沪上阿姨冲刺港交所:战略性聚焦下沉市场,2023年前三季度净利润同比增长188.7%
推荐内容
  • SVD视频生成模型的Web平台开始发放测试资格
  • 备战小米手机发布会!卢伟冰:仔细看了几遍小米14 Ultra白皮书
  • 这届网友,在小红书复盘了春晚名场面
  • 新一代安卓之光!小米14 Ultra影像配置曝光:LYT900配无级可变光圈
  • 胖东来在门口给顾客身上扫雪:对顾客关爱有加 提供温馨服务
  • 新研究:切尔诺贝利的狼已进化出能力