会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 谷歌AI提出MathWriting:整合人工书写和合成数据集等改变手写数学表达式识别!

谷歌AI提出MathWriting:整合人工书写和合成数据集等改变手写数学表达式识别

时间:2024-07-02 04:11:59 来源:带水拖泥网 作者:知识 阅读:229次

谷歌AI提出MathWriting:整合人工书写和合成数据集等改变手写数学表达式识别

划重点:

⭐ 谷歌 AI 发布 MathWriting 数据集,谷歌工书改变为在线手写数学表达提供230k 人工编写和400k 合成样本,提出成为 ME 识别新标杆

⭐ MathWriting 数据集比 CROHME23具有更多样本和标签,合人合成包括广泛的写和数学符号和语法标记

⭐ MathWriting 支持训练模型、评估性能,数据手写数学式识并提供未来发展方向的表达别参考

CSS站长资源(ChinaZ.com)4月24日 消息:近年来,在线文本识别模型取得了显著进展,谷歌工书改变但数学表达(ME)识别作为更为复杂的提出任务仍未得到足够关注。

谷歌研究团队推出了 MathWriting,合人合成一个专注于在线手写数学表达的写和数据集,包含230k 人工编写和400k 合成样本,数据手写数学式识超越了类似 IM2LATEX-100K 的表达别离线 HME 数据集。与其他在线数据集兼容,谷歌工书改变MathWriting 以 InkML 格式共享,提出并通过栅格化墨迹有效扩展了离线 HME 数据集。合人合成这一举措为 ME 识别引入了新的标准,提供了标准化的真实表达以简化训练和强化评估,同时在 GitHub 上提供代码示例以便于使用。

与 CROHME23相比,MathWriting 样本数量几乎是其近3.9倍,标签数量经过归一化后增加了4.5倍。MathWriting 不仅具有更多人工编写的墨迹,还提供了更广泛的符号范围,包括大部分希腊字母和矩阵等,从而能够代表量子力学、微积分和线性代数等各种科学领域。

MathWriting 数据集包括253k 人工编写表达和6k 孤立符号用于训练、验证和测试,同时还有396k 合成表达。发布在知识共享许可下,以 LATEX 标准化注释作为真实标准,基于 MathWriting 的测试部分,使用字符错误率(CER)指标构建手写数学表达识别基准。各种识别模型,包括 CTC Transformer 和 OCR,展示了数据集的实用性。数据收集涉及人类贡献者通过 Android 应用程序复制渲染表达式,随后经过最少的后处理和标签归一化以提高模型性能。

MathWriting 数据集相比 CROHME23提供了手写数学表达的详细信息,包括广泛的标签和墨迹统计,为了多样性提供了宝贵信息。尽管存在识别挑战,但 MathWriting 是训练和评估手写识别模型的全面资源,为了提供对真实识别场景的见解。

MathWriting 具有广泛的应用,支持跨科学领域的识别训练,并能够生成合成表达式。与 CROHME23等数据集的整合有望提高模型性能和多样性。边界框数据有助于生成合成墨迹,可能为更自然的合成改进 LATEX 的严格结构。此外,还提供了用于 UI 功能的字符分割途径。未来的研究可以专注于优化训练 / 验证 / 测试分割以及开发针对数学表达的语言模型。

论文:https://arxiv.org/abs/2404.10690

(责任编辑:短视频)

相关内容
  • InstructIR:可按照人类指令进行高质量图像修复
  • Comate编程助手官网体验入口 百度AI代码生成工具使用指南方法教程
  • MovieLLM: 一个词或一句话就能合成电影级视频
  • 苹果 M3 MacBook Air今日首销:售价8999元起
  • 苹果宣布将在今年公布新的AI功能 去年已创建大模型Ajax
  • 对话爆款短剧导演:爆剧没有标准,现在入行亏钱
  • 丰田电动化转型全力加码电池!宣布一项战略性收购
  • 县城中产等不及加盟海底捞了
推荐内容
  • 1月销量环比大跌3成  零跑汽车官宣全系降价
  • 微软打入谷歌“大本营”:在谷歌搜索中投放必应搜索广告!
  • 杭州小伙买100万黄金一年赚50%:金价展现强劲增长势头
  • 一图看懂B站2023年财报:日活用户破亿 300万UP主赚到钱
  • 安徽男子开小飞机带女儿回家过年:是飞行教员 比开车快2个多小时
  • 乌苏啤酒状告鸟苏啤酒获赔208万 法院:商标构成近似