苹果推出降噪语言模型DLM 用于纠正ASR系统中的错误-带水拖泥网

当前位置：首页 > 知识 > 苹果推出降噪语言模型DLM 用于纠正ASR系统中的错误正文

苹果推出降噪语言模型DLM 用于纠正ASR系统中的错误

时间：2024-07-04 05:17:27 来源：带水拖泥网作者：资讯阅读：141次

苹果推出降噪语言模型DLM 用于纠正ASR系统中的错误

CSS站长资源（ChinaZ.com）5月28日消息:苹果最近推出了一项新的苹果技术创新，去噪语言模型（DLM），推出通过大量合成数据的降噪训练，取得了超越以往的语言M用于纠成就，实现了自动语音识别(ASR)领域的模型最新性能水平。

这项技术的正A中核心在于使用文本转语音（TTS）系统创建音频，并将其输入ASR系统，系统通过这种方式产生了嘈杂的错误假设，与原始文本进行配对，苹果从而训练DLM。推出该方法的降噪关键要素包括升级的模型和数据、多说话人TTS系统、语言M用于纠各种噪声增强策略以及新的模型解码技术。

研究显示，正A中单个DLM可以应用于不同的系统ASR系统，其性能显著优于传统的基于语言模型（LM）的集束搜索重新评分方法。这一突破意味着精心设计的纠错模型可以取代传统的LM，将ASR系统的准确率提升到一个新的高度。尤其值得注意的是，DLM在LibriSpeech上实现了1.5%的字错误率(WER)，这是不使用外部音频数据时报告的最佳数字之一，证明了其卓越性能。

然而，DLM面临的挑战之一是需要大量的监督训练示例，而这在典型的ASR数据集中是有限的。为了解决这一问题，DLM采用了使用TTS系统生成合成音频的方法，从而扩展了训练数据集的规模。这种创新性的做法为DLM的性能提升提供了更广阔的空间，使其在ASR领域引领潮流。

(责任编辑：短视频)

[1]

[2]

[3]

上一篇：决战拜年之巅免费在线体验入口 ChatMindAI聊天机器人过年游戏使用地址
下一篇：巨日禄AI体验入口小说故事AI绘画转视频工具在线使用地址