会员登录 - 用户注册 - 设为首页 - 加入收藏 - 网站地图 Groq​大模型推理芯片每秒500tokens超越GPU,喊话三年超过英伟达!

Groq​大模型推理芯片每秒500tokens超越GPU,喊话三年超过英伟达

时间:2024-07-04 04:59:14 来源:带水拖泥网 作者:电商 阅读:357次

Groq​大模型推理芯片每秒500tokens超越GPU,喊话三年超过英伟达

划重点:

1. Groq公司推出的​大达大模型推理芯片,每秒500tokens的模型每秒惊人速度超越了传统GPU,挑战谷歌TPU。推理

2. 该芯片由初创公司Groq研发,芯片由谷歌TPU团队原班人马打造,超越超过推理速度提高10倍,喊话年成本降低十分之一,英伟支持多种大模型。​大达

3. Groq的模型每秒目标是在三年内超越英伟达,采用自创的推理LPU方案,克服计算密度和内存带宽瓶颈,芯片实现18倍于云平台速度的超越超过推理性能。

CSS站长资源(ChinaZ.com)2月20日 消息:Groq公司推出的喊话年大模型推理芯片以每秒500tokens的速度引起轰动,超越了传统GPU和谷歌TPU。英伟该芯片由初创公司Groq研发,​大达其团队成员来自谷歌TPU,包括创始人兼CEO Jonathan Ross,曾设计实现第一代TPU芯片的核心元件。

Groq采用了全球首个LPU(Language Processing Unit)方案,旨在克服计算密度和内存带宽的瓶颈,最终实现大模型推理性能比其他云平台厂商快18倍。据介绍,英伟达GPU需要大约10到30焦耳才能生成响应中的tokens,而Groq仅需1到3焦耳,使得推理速度提高了10倍,成本降低十分之一,性价比提高了100倍。

Groq的芯片采用14nm制程,搭载了230MB大SRAM以保证内存带宽,片上内存带宽高达80TB/s。在算力方面,该芯片的整型(8位)运算速度为750TOPs,浮点(16位)运算速度为188TFLOPs。基于自研的TSP架构,Groq利用机器学习工作负载的并行性对推理进行加速,并支持通过PyTorch、TensorFlow等标准机器学习框架进行推理。

Groq公司在演示中展示了其芯片的强大性能,支持Mixtral8x7B SMoE、Llama2的7B和70B等多种模型,并可直接体验Demo。不仅如此,Groq还喊话各大公司,扬言在三年内超越英伟达。该公司的推理芯片在第三方网站上的售价为2万多美元。

Groq公司以其创新的LPU方案和超越性能的大模型推理芯片,成为大模型推理领域令人瞩目的新兴力量,引领着技术的飞速发展。

Groq产品的特色亮点如下:

1. API访问速度极快:Groq提供了API密钥,可以访问世界上最快的开源大型语言模型(LLM)推理速度。他们的实现在Anyscale的LLMPerf Leaderboard上展示了相较于云服务提供商高达18倍的推理性能。

2. 支持开源LLM模型:*Groq支持Llama2-70B和7B,这两个由Meta AI创建的领先的开源基础LLM模型。这些Groq实现使用4096的上下文长度。

3. 支持其他模型:*除了Llama系列外,Groq还支持Mixtral8x7B,由Mistral AI创建,可根据请求提供。其他模型如Mistral和CodeLlama也可根据特定客户请求提供。

4. 免费试用期: 提供为期10天的免费试用期,可以根据请求进行刷新。在试用期间,用户将获得100万免费令牌,并且API与OpenAI API完全兼容。

5. 价格保证: Groq保证以击败任何已发布的相应模型的百万令牌价格。他们的定价相对较低,可以提供更具竞争力的服务。

6. 早期访问计划: Groq提供了Alpha版本的API的早期访问计划,免费供研究和开发目的使用。公共可用性计划于2024年第二季度。

7. 高性能硬件支持: Groq引擎(LPU™ Inference Engine)在性能上优越,通过硬件支持实现了18倍于云服务提供商的LLM推理性能。

Groq产品以其出色的推理性能、对多种开源LLM模型的支持以及具有竞争力的价格政策等特色,成为一个引人注目的选择。

项目入口:https://top.aibase.com/tool/groq

(责任编辑:知识)

相关内容
  • BiTA:创新AI方法加速大型语言模型生成
  • 支付宝“春季消费节”发10亿红包,平台开放助千万商家促消费
  • 比亚迪百万豪华轿车:仰望U7首搭革命性悬架技术云辇-Z
  • 小米汽车回应SU7玻璃镀银影响信号:实测不影响
  • 雷军:卢伟冰将兼任小米品牌总经理 并主讲小米14 Ultra
  • 批大模型独角兽,创始人已经开始套现了?
  • 全球!LG量产双模游戏OLED面板:可切换刷新率和分辨率
  • 微信发布桌面效率AI工具小微助手 支持类ChatGPT在线聊天问答功能
推荐内容
  • 两广地区家里水帘洞户外南天门 网友:墙壁代写成新“业务”
  • iQOO Z9系列销量创新高:预售量为Z系列历史纪录的6倍
  • 戒掉“超头依赖症”,国货美妆依旧没有新爆款
  • iQOO Z9 Turbo正式发布,iQOO品牌激活量同比增长30%
  • 12306回应高铁超载:不建议买短补长 补票需要咨询列车员
  • 雷军北京车展晒成绩单:小米SU7上市28天创新纪录,锁单75723台,已交付5781台