会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 清华报告:文心一言4.0多项指标!

清华报告:文心一言4.0多项指标

时间:2024-07-04 04:36:28 来源:带水拖泥网 作者:热点 阅读:815次

清华报告:文心一言4.0多项指标

快科技4月23日消息,清华由清华大学基础模型研究中心最新发布的报告标2024年3月版《SuperBench大模型综合能力评测报告》中,共涵盖了14个具有海内外影响力的文心模型。

在此次评测中,言多文心4.0的清华表现令人瞩目,其性能接近国际顶级模型,报告标且与顶尖模型的文心差距正在逐步缩小,堪称国内领先模型。言多

例如,清华在人类对齐能力的报告标评测中,文心4.0以卓越的文心表现位居国内首位。

在中文推理和中文语言的言多评测中,文心4.0遥遥领先,清华与其他模型相比,报告标差距明显。文心在中文理解上,文心4.0的领先优势尤其突出,比第二名的GLM-4高出0.41分。

在语义理解的数学能力评测中,文心4.0与Claude-3并列全球第一,而GPT-4系列模型则位列第四和第五,其他模型的得分主要集中在55分左右,显著落后于领先群体。

在阅读理解能力的评测中,文心4.0超越了GPT-4 Turbo、Claude-3以及GLM-4,取得了最高的成绩。

在企业最关注的安全性评测中,文心4.0同样表现出色,力压国际一流的GPT-4系列模型和Claude-3,获得了最高分(89.1分),而Claude-3仅位列第四。

数据还显示,自去年3月16日文心一言首次亮相以来,用户数量已经突破了2亿,每天的API调用量也超过了2亿次。

(责任编辑:业界)

相关内容
  • 优酷独播!东北喜剧《乡村爱情16》今日开播:赵本山主演
  • 大厂AI人,奔向香港
  • 科大讯飞董事长回应买蔚来原因:性能出色 加速快
  • 微软发布研究报告:75%的知识工作者在工作中使用AI
  • 女子因彩礼和相恋8年男友分手:18.8万都会带到新家 还陪嫁车
  • 谷歌DeepMind发布AlphaFold 3 有望加速药研发
  • 一年做到品类销量,退货率仅5%,他们做对了什么?
  • 一部短剧带火一座城,是真风口还是伪概念?
推荐内容
  • 董宇辉访谈刘德华宁浩 刘德华在董宇辉直播间唱恭喜发财
  • Air名不副实!苹果全新iPad Pro比Air更轻薄
  • 电动牙刷真比普通牙刷好用吗 专家回应
  • 一年做到品类销量,退货率仅5%,他们做对了什么?
  • 华科大发布多模态大模型新基准 覆盖五大任务
  • Dreamina正式更名为“即梦”  AI绘画和AI视频功能全量上线