会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 阿里开源千亿参数模型 Qwen1.5-110B,性能超越 Meta-Llama3-70B!

阿里开源千亿参数模型 Qwen1.5-110B,性能超越 Meta-Llama3-70B

时间:2024-07-02 04:04:40 来源:带水拖泥网 作者:热点 阅读:884次

阿里开源千亿参数模型 Qwen1.5-110B,性能超越 Meta-Llama3-70B

CSS站长资源(ChinaZ.com)4月28日 消息:近日,阿里阿里巴巴宣布开源其最新的开源 Qwen1.5系列语言模型 - Qwen1.5-110B。这是千亿 Qwen1.5系列中规模最大的模型,也是参数该系列中首个拥有超过1000亿参数的模型。

据悉,模型Qwen1.5-110B采用了与其他Qwen1.5模型相同的阿里Transformer解码器架构,并引入了分组查询注意力(GQA)机制,开源在模型推理时更加高效。千亿该模型支持32K tokens的参数上下文长度,同时仍然是模型多语言的,支持英、阿里中、开源法、千亿西、参数德、模型俄、日、韩、越、阿等多种语言。

与最近发布的SOTA语言模型Meta-Llama3-70B和Mixtral-8x22B进行对比,结果显示Qwen1.5-110B在基础能力方面至少与Llama-3-70B相媲美。

阿里巴巴表示,与之前发布的72B模型相比,在两个聊天模型的基准评估中,110B模型表现显著更好,这表明即使在没有大幅改变后训练方法的情况下,更强大、更大规模的基础语言模型也可以带来更好的聊天模型性能。

Qwen1.5-110B是Qwen1.5系列中规模最大的模型,也是该系列中首个拥有超过1000亿参数的模型。它在与最近发布的SOTA模型Llama-3-70B的性能上表现出色,并且明显优于72B模型。

(责任编辑:深度)

相关内容
  • 男子屋顶清雪不慎被推下地面:伤势严重 清理积雪需注意
  • 打工人龙年道坎,是抢不到春运回程票
  • 新一代小米旗舰外观首发!雷军晒小米14 Ultra:这设计你给打几分
  • 小米 14 Ultra官宣2月22日发布
  • 6岁女孩在爸爸公司年会上自信跳舞 乐坏了旁边的妈妈
  • 腾讯小米为员工发开工红包:龙年开工天 寓意吉祥
  • ReadAgent官网体验入口 AI高效阅读和推理工具使用方法教程指南
  • 真·降维打击,Sora与Runway、Pika的对比来了,震撼效果背后是物理引擎模拟现实世界
推荐内容
  • 迄今能效量子点太阳能电池面世:能效高达18.1%
  • HiddenArt.AI官网体验入口 图像生成AI工具软件在线免费试用地址
  • ​谦寻控股回应急聘近万名“数字人”:纯属造谣
  • 2024年春节档票房破80亿 打破中国影史多项纪录
  • 深圳地铁感谢格力:用了格力空调一年省1456万元!
  • AI变革时代:95.8%的人都没有做好准备