通义千问开源基于Qwen1.5的代码模型CodeQwen1.5
CSS站长资源(ChinaZ.com)4月17日 消息:通义千问昨晚开源了基于Qwen1.5的通义代码模型CodeQwen1.5,这是千问一个基于 Qwen 语言模型的代码专家模型。CodeQwen1.5拥有7B 参数,开源采用 GQA 架构,基于经过约3T tokens 代码数据的码模预训练,支持92种编程语言,通义并且能够处理最长64K 的千问上下文输入。
在代码生成、开源长序列建模、基于代码修改和 SQL 能力等方面,码模CodeQwen1.5展现出了卓越的通义性能,极大地提升了开发人员的千问工作效率,并简化了软件开发流程。开源
在代码生成方面,基于CodeQwen1.5已经超越了许多更大尺寸的码模模型,缩小了开源 CodeLLM 与 GPT-4之间在编码能力上的差距。通过 HumanEval 和 MBPP 的评估,CodeQwen1.5在各项指标上均表现出色。
此外,LiveCodeBench 的评估显示,CodeQwen1.5在 LeetCode、AtCoder 和 CodeForces 三个竞赛平台的问题上具有极强的泛化能力,尽管其预训练语料中包含了 LeetCode 的数据。
CodeQwen1.5不仅精通 Python,还支持多种编程语言。在 MultiPL-E 的8种主流语言上进行全面评估,CodeQwen1.5证明了其多语言编程的卓越能力。长序列能力对于代码模型至关重要,CodeQwen1.5通过精心构造的长序列代码数据预训练,实现了最长64K 输入长度的支持。
在实际应用方面,CodeQwen1.5在 SWE Bench 上的表现尤为突出,它能够理解代码仓库并生成可通过单测的代码,解决了真实软件开发中的问题。
CodeQwen1.5在代码修改方面的能力也得到了验证,它在 CodeEditorBench 的四个方面——Debug、Translate、Switch、Polish——均达到了最佳效果。
作为一个智能的 SQL 专家,CodeQwen1.5通过自然语言查询数据库,极大地降低了非编程专业人士与高效数据交互之间的学习曲线。在 Spider 和 Bird 两个流行的文本到 SQL 基准测试中,CodeQwen1.5的性能接近 GPT-4,显示了其在 SQL 领域的强大实力。
CodeQwen1.5作为 Qwen1.5开源家族的一员,目前已支持多种平台和工具,如 Transformers, vLLM, llama.cpp, Ollama 等。开源社区对 CodeQwen1.5的发布充满期待,希望它在代码助手、Code Agent 等方面为社区做出贡献,并在未来的代码智能建设中发挥重要作用,实现真正的 AI 程序员。
详细模型介绍:https://qwenlm.github.io/zh/blog/codeqwen1.5/
(责任编辑:知识)
- ·今年冰冻预警发布!今冬寒潮来袭:冻伤记得挂烧伤科
- ·搜索引擎引DuckDuckGo推出AI Chat聊天机器人,承诺保护对话隐私
- ·字节重回“牌桌”,腾讯“硬刚”魔兽世界,新一轮战役打响?
- ·实测完快手的AI视频「可灵」后,我觉得这才是个中国版Sora
- ·文心一言APP数字分身体验入口 百度AI情感交互数字化身应用免费在线使用地址
- ·没有新车近期却卖爆 蔚来做对了什么:董事长李斌公开回应
- ·广大考生妥善保管好证件!2024第1批弄丢身份证的考生出现了
- ·《英雄联盟》史上最贵!Faker名人堂皮肤国服售价公布:3286元
- ·大熊猫丫丫过小年:收到特别礼物笋笋
- ·199元!Redmi Buds 6S发布:半入耳主动降噪 支持空间音频
- ·不怕投诉了!高铁有遛娃车厢了:餐车车厢部分区域临时改造
- ·字节重回“牌桌”,腾讯“硬刚”魔兽世界,新一轮战役打响?
- ·大二女生175斤减到94斤变化惊艳:越来越自信了
- ·360AI 甄选功能介绍及免费使用指南 AI办公导航网站体验地址入口
- ·大熊猫性感抖臀致直播间被封十分钟 人工智能「直播」AI应用有哪些?
- ·俞敏洪回应直播言论争议:“东方甄选做得乱七八糟”只是谦虚表达
- ·现代技术还原《九歌》!95后用Vidda三色激光投影演绎屈原诗歌
- ·媲美Sora?快手文生视频模型可灵开放测试 更懂物理,最长可生成2分钟视频
- ·12306回应遛娃车厢:暂未接到通知 上车后可跟乘务员询问相关事宜
- ·AI成高考作文题目!来看各大厂商的AI“考生”如何作答