会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 幻方DeepSeek-V2系列模型已在魔搭社区开源!

幻方DeepSeek-V2系列模型已在魔搭社区开源

时间:2024-07-02 03:48:28 来源:带水拖泥网 作者:业界 阅读:999次

幻方DeepSeek-V2系列模型已在魔搭社区开源

CSS站长资源(ChinaZ.com) 5月8日 消息:魔搭ModelScope社区宣布,幻方DeepSeek-V2系列模型现已在魔搭ModelScope社区开源。系型已

据悉,列模幻方公司在5月6日推出了第二代 MoE 模型 DeepSeek-V2,魔搭并开源了技术报告和模型权重,社区该模型引入了 MLA 架构和自研 Sparse 结构 DeepSeekMoE,开源以236B 总参数、幻方21B 激活,系型已实际部署在8卡 H800机器上,列模输入吞吐量超过每秒10万 tokens 输出超过每秒5万 tokens。魔搭

性能方面,社区在目前大模型主流榜单中,开源DeepSeek-V2均表现出色:

  • 中文综合能力(AlignBench)开源模型中最强,幻方与GPT-4-Turbo,系型已文心4.0等闭源模型在评测中处于同一梯队

  • 英文综合能力(MT-Bench)与最强的列模开源模型LLaMA3-70B同处第一梯队,超过最强MoE开源模型Mixtral8x22B

  • 知识、数学、推理、编程等榜单结果也位居前列

  • 支持128K上下文窗口

和DeepSeek67B相比,DeepSeek-V2节约了42.5%训练成本,推理的KV Cache节约了93.3%,最大吞吐是之前的576%。

DeepSeek-V2的推理代码和模型下载链接已经在魔搭 ModelScope 社区开源,用户可以通过该平台直接下载模型。

项目地址:

DeepSeek-V2-Chat:

https://modelscope.cn/models/deepseek-ai/DeepSeek-V2-Chat

DeepSeek-V2:

https://modelscope.cn/models/deepseek-ai/DeepSeek-V2

(责任编辑:自媒体)

相关内容
  • 库克确认,苹果生成式AI功能将于今年晚些时候推出
  • 小红书博主发布9张治愈系AI插画走红 获赞2.6万
  • 研究显示,GPT-4可以自主利用安全漏洞,具备攻击性
  • iPhone 16 Pro售价曝光:256GB起步约7999元,终于摆脱128GB束缚
  • 花130万当网红未果起诉要回80万引热议 网友:现在火上热搜了
  • AI日报:Adobe全新生图模型Firefly3可以垫图了;免费用户将可创建GPTs;妙鸭相机加入钉钉个人版;AI砍价是懂怎么让人尴尬的
  • 卖身传闻中的盒马,值多少钱?
  • 雷军透露小米SU7毛利率:小米汽车智驾团队一年预算15亿 有超1千名工程师
推荐内容
  • 阿里推自主多模态AI代理MobileAgent 可模拟人类操作手机
  • 对话蚂蚁李建国:当前AI写代码相当于L2.5,实现L3后替代50%人类编程
  • 钉钉直播上线「智能封面」功能 妙鸭相机加入钉钉个人版
  • 曝小米Redmi 13手机已通过3C认证:支持33W快充!
  • 《完蛋!我被美女包围了!》DLC倒计时海报:美女室友让人心跳
  • 曾秒售罄口袋AI设备Rabbit R1竟是一场骗局?设备源代码曝光