会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 新机器学习框架DRAGIN:用于大语言模型中的动态检索增强,胜过传统方法!

新机器学习框架DRAGIN:用于大语言模型中的动态检索增强,胜过传统方法

时间:2024-07-02 04:03:38 来源:带水拖泥网 作者:业界 阅读:998次

新机器学习框架DRAGIN:用于大语言模型中的动态检索增强,胜过传统方法

划重点:

⭐️ DRAGIN 是新机习框一种适用于大型语言模型的动态检索增强生成框架,能够根据实时信息需求动态确定何时以及如何检索外部信息。器学

⭐️ 该框架包括两个关键组件:实时信息需求检测(RIND)和基于自注意力的架D检索查询构建(QFS),在四个知识密集型数据集上表现优异。用于大语

⭐️ DRAGIN 在提高语言模型性能方面具有明显优势,模型通过优化检索激活时机和查询精度,中的增强有效增强了语言模型的动态生成能力。

CSS站长资源(ChinaZ.com)4月3日 消息:研究人员从清华大学和北京理工大学开发了 DRAGIN,胜过这是传统一种针对大型语言模型设计的动态检索增强生成框架。

该框架旨在通过在文本生成过程中实时确定何时以及如何检索外部信息,新机习框从而提高语言模型的器学性能。为了解决当前方法在确定何时进行检索和检索内容方面过于静态的架D检索问题,DRAGIN 引入了 RIND 和 QFS 两个关键组件。用于大语其中,模型RIND 主要用于确定检索时机,中的增强考虑语言模型的不确定性和令牌重要性;而 QFS 则用于构建查询,利用上下文的自注意力机制优先选择与当前上下文相关的令牌。通过这种动态检索的方式,DRAGIN 在四个知识密集型数据集上表现出色,而且无需额外的训练或提示工程。

传统的单轮检索增强方法通过将初始输入作为查询,将外部知识引入到语言模型中。以往的研究已经深入探讨了这种方法,例如 REPLUG 使用语言模型生成检索模型的训练数据,UniWeb 则自我评估是否需要检索。然而,对于需要大量外部知识的复杂任务,多轮检索变得至关重要。DRAGIN 则采用了新颖的多轮检索方法,通过 FLARE 在遇到不确定令牌时触发检索,从而提高检索相关性,同时考虑了语言模型的实时信息需求。

DRAGIN 是一个旨在解决语言模型动态检索增强方法的框架。通过 RIND 和 QFS 优化检索激活时机和查询精度,使得在知识密集型任务上取得更好的性能。尽管它依赖于基于 Transformer 的语言模型的自注意力机制,但 DRAGIN 展现出了显著的有效性。未来的工作旨在克服与自注意力可访问性相关的限制,并对查询构建技术的影响进行评估。

论文:https://arxiv.org/abs/2403.10081

(责任编辑:资讯)

相关内容
  • 苹果Vision Pro发售:竞争对手Meta单日大涨20%创纪录!
  • 各平台先后推出直播技术服务费,目前淘宝费率
  • Open Sora官网体验入口 AI视频生成工具开源资源下载地址
  • 王腾一句话总结第三代骁龙8s:介于8 Gen3和8 Gen2之间
  • 1TB都不够用!微信安装包突破700MB 首版仅457KB:网友吐槽98%文件是垃圾
  • 余承东:华为豪华旗舰轿车享界S9提供增程版
  • 28岁徒步西藏女孩明年打算徒步出国:去探索更多未知
  • 八宝粥成小米14 Ultra镜头盖后 飞机杯托完美适配OPPO Find X7
推荐内容
  • 智能海报生成平台嗨AI海报 30秒批量生成带货海报
  • 三岁半孙子每天给开公交的爷爷送饭 网友们被深深打动
  • 首发第三代骁龙7 !一加Ace 3V官宣3月21日发布
  • 苹果“Apple ID”将成为历史!在iOS 18改名为“苹果账户”
  • 进击的闲鱼:牵手微信,开线下商店
  • 占用应急车道插队未果 两男子怒殴前车 官方通报:罚款、拘留