会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 孟子3-13B大模型正式开源!

孟子3-13B大模型正式开源

时间:2024-07-02 04:03:12 来源:带水拖泥网 作者:深度 阅读:430次

孟子3-13B大模型正式开源

CSS站长资源(ChinaZ.com)4月1日 消息:澜舟科技近日宣布,大模其研发的型正孟子3-13B大模型正式开源,并向学术研究领域全面开放,式开同时支持免费商用。大模这一轻量化大模型在多项基准测试中展现了优异的型正性能,特别是式开在参数量20B以内的模型中,其中英文语言能力尤为突出,大模数学和编程能力也位于行业前列。型正

孟子3-13B大模型基于Llama架构,式开经过高达3T Tokens的大模数据集训练,该数据集包括网页、型正百科、式开社交、大模媒体、型正新闻以及高质量的式开开源数据集。模型在万亿tokens上进行了多语言语料的继续训练,使其中文能力得到显著提升,同时也具备了强大的多语言处理能力。

项目地址:https://github.com/Langboat/Mengzi3

为了便于用户快速部署和使用,澜舟科技提供了简单的两步操作。首先,用户需要进行环境配置,通过pip命令安装必要的依赖。随后,用户可以通过提供的代码快速开始使用模型,进行基础的交互推理。此外,澜舟科技还提供了样例代码和模型微调的相关文件和代码,以便用户根据自己的需求进行定制和优化。

澜舟科技的选择背后有着明确的商业考量。公司专注于服务ToB场景,并在实践中发现,ToB场景中使用频率最高的大模型参数量集中在10B-100B之间。从投资回报率角度出发,这一参数规模范围的模型既能满足场景需求,又具有高性价比。因此,澜舟科技致力于在这一参数规模范围内打造优质的行业大模型。

孟子3-13B大模型的开源,是澜舟科技在大模型领域的又一重要里程碑。去年3月,澜舟科技发布了孟子GPT V1(MChat),今年1月,孟子大模型GPT V2对公众开放。现在,感兴趣的用户可以通过GitHub、HuggingFace、ModelScope和Wisemodel等平台体验和使用孟子3-13B大模型。

随着孟子3-13B大模型的开源,澜舟科技进一步巩固了其在AI大模型行业的领先地位,并为学术研究和商业应用提供了强大的支持。这一举措无疑将推动大模型技术的发展和应用,为AI产业的进步贡献力量。

(责任编辑:小程序)

相关内容
  • 问界新M7助力AITO汽车登顶,月交付3万 诠释“新王登基”
  • 微信出手:处理公众号标题党 含“彻底沸腾”等煽动性表述
  • 广东一大学生骑行900公里返校 一天最远曾骑200公里
  • ofo被强制执行1686万 涉及承揽合同纠纷
  • 搞笑富家女“猫一杯”疯狂吸粉过千万,她凭什么通吃各大平台
  • 微信出手:处理公众号标题党 含“彻底沸腾”等煽动性表述
  • Redmi K70系列累计销量超280万台:K70拿下2K-3K销量
  • 李彦宏:百度文心大模型推理成本已降至1%!与三星、荣耀等达成合作
推荐内容
  • 联发科天玑9400跑分曝光:多核成绩苹果A17 Pro
  • 曝小米14 Ultra新配色已在路上:米粉集体呼唤白色陶瓷
  • 400名大学生回曹县小镇卖马面裙:忙碌时店铺一天要打包2000件
  • 数据分析运营商EXL与微软合作,利用生成式AI推动创新
  • 2月发!真我12 Pro系列将搭载6400万超光影潜望长焦:四千元档旗舰同款
  • 《完蛋!我被美女包围了!》今日更新:修复两大BUG 你遇到了吗