会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 苹果推出降噪语言模型DLM 用于纠正ASR系统中的错误!

苹果推出降噪语言模型DLM 用于纠正ASR系统中的错误

时间:2024-07-04 05:17:27 来源:带水拖泥网 作者:资讯 阅读:141次

苹果推出降噪语言模型DLM 用于纠正ASR系统中的错误

CSS站长资源(ChinaZ.com)5月28日 消息:苹果最近推出了一项新的苹果技术创新,去噪语言模型(DLM),推出通过大量合成数据的降噪训练,取得了超越以往的语言M用于纠成就,实现了自动语音识别(ASR)领域的模型最新性能水平。

这项技术的正A中核心在于使用文本转语音(TTS)系统创建音频,并将其输入ASR系统,系统通过这种方式产生了嘈杂的错误假设,与原始文本进行配对,苹果从而训练DLM。推出该方法的降噪关键要素包括升级的模型和数据、多说话人TTS系统、语言M用于纠各种噪声增强策略以及新的模型解码技术。

研究显示,正A中单个DLM可以应用于不同的系统ASR系统,其性能显著优于传统的基于语言模型(LM)的集束搜索重新评分方法。这一突破意味着精心设计的纠错模型可以取代传统的LM,将ASR系统的准确率提升到一个新的高度。尤其值得注意的是,DLM在LibriSpeech上实现了1.5%的字错误率(WER),这是不使用外部音频数据时报告的最佳数字之一,证明了其卓越性能。

然而,DLM面临的挑战之一是需要大量的监督训练示例,而这在典型的ASR数据集中是有限的。为了解决这一问题,DLM采用了使用TTS系统生成合成音频的方法,从而扩展了训练数据集的规模。这种创新性的做法为DLM的性能提升提供了更广阔的空间,使其在ASR领域引领潮流。

(责任编辑:短视频)

相关内容
  • 华为全国都能开的高阶智驾来了!2月1日起陆续推送
  • 排面拉满!北京车展大门横幅就是小米SU7
  • Nvidia CEO黄仁勋亲自向OpenAI交付台DGX H200
  • 小米回应SU7翼子板脱落:车辆高速涉水行驶 仅个例出现
  • 顶配卖近3万元!库克回应Vision Pro太贵:用了5000项专利
  • 比Gemini Pro1.5强!可解读视频的多模态模型​Pegasus-1公测
  • 与纯血鸿蒙同台亮相!华为盘古大模型5.0六月发布
  • 小米汽车回应SU7玻璃镀银影响信号:实测不影响
推荐内容
  • 知名车评人谈智能驾驶:无论如何进化、都不可能比我开得好
  • iQOO Z9 Turbo搭载旗舰同款C8 护眼屏,更亮更护眼
  • 华为超充联盟成立!理想、比亚迪、长城、小鹏等车企加入
  • 小米汽车回应SU7玻璃镀银影响信号:实测不影响
  • 华科大发布多模态大模型新基准 覆盖五大任务
  • 人参泡酒15年后竟“复活”:新芽破皮而出