会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 阿里魔搭社区开源推理引擎 DashInfer!

阿里魔搭社区开源推理引擎 DashInfer

时间:2024-07-02 03:51:14 来源:带水拖泥网 作者:热点 阅读:895次

阿里魔搭社区开源推理引擎 DashInfer

CSS站长资源(ChinaZ.com)5月24日 消息:ModelScope 推出了预训练大语言模型(LLM)推理引擎 DashInfer,阿里支持 C++ 和 Python 语言接口,魔搭可在多种 CPU 架构上高效推理大模型。社区

DashInfer 采用 C++ Runtime 编写,开源支持连续批处理和多 NUMA 推理,推理能充分利用服务器级 CPU 的引擎算力,为推理14B 及以下的阿里 LLM 模型提供更多硬件选择。该引擎已开源,魔搭提供轻量级架构,社区高精度实现,开源优化的推理计算 Kernel,以及行业标准 LLM 推理技术。引擎DashInfer 支持主流 LLM 开源模型和 PTQ 量化技术。阿里

此外,魔搭引擎还提供多语言 API 接口,社区支持多种硬件和数据类型,包括 x86CPU 和 ARMv9CPU,以及 FP32、BF16、InstantQuant 等数据类型。关于模型支持,DashInfer 可以加载和序列化模型,执行推理过程,并采用 DLPack 格式的 tensor 与外部框架交互。在单 NUMA 架构下,推理引擎使用多线程和线程池进行调度;而在多 NUMA 架构下,引擎采用多进程 client-server 架构,实现 tensor parallel 的模型推理。

性能测试结果表明,DashInfer 在 ARM 和 x86CPU 上具有良好的推理性能,能够有效提升大模型推理效率。

代码开源地址:

https://github.com/modelscope/dash-infer

推理体验地址:

https://www.modelscope.cn/studios/modelscope/DashInfer-Demo

(责任编辑:短视频)

相关内容
  • 女孩家中遭变故 高铁站长5秒帮改签:业务娴熟 有人情味儿
  • 滴滴程维:柳青升任合伙人 不再设总裁岗位
  • viva发布类Sora视频生成模型 支持4K分辨率
  • GPT-4o团队引发OpenAI组织创新热议,应届生领衔Sora,本科生带队GPT-1,经验职级都是浮云
  • AI智能剪辑软件AIMIX 支持短视频批量混剪、文案、字幕生成、语音合成等
  • 00后官号运营,正在用猫meme勇闯职场
  • GPT-4o恩怨开局,Google再次躺枪
  • 娱乐巨头CAA 推出人工智能克隆保护服务 帮助明星管理数字遗产
推荐内容
  • 小米竖折旗舰!小米MIX Flip搭载国产屏:创新零感折痕技术
  • 马斯克预测人类30年内在火星建城市引热议:人类文明太脆弱 我希望能在火星上死去
  • 微信转账520和1314能要回吗:特定时间特殊数字转账一般认定为赠与
  • 沉迷拍土味视频获赞1000万,张雨绮对标王七叶,放下贵圈情节自有网红新路
  • 2024大模型应用元年,科大讯飞率先打响商业化枪
  • 东北虎猎杀东北豹 豹子身体被啃食一半:后续来了 继承者现身