Cerebras 以最快的 Llama 4 Maverick 性能引领 LLM 推理竞赛
2025-10-29 18:30:58阅读量:11 字体:大 中 小
上周,Nvidia 宣布 DGX B200 中的 8 个 Blackwell GPU 可以在 Meta 的 Llama 4 Maverick 上展示每个用户每秒 1,000 个代币 (TPS)。今天,同一家独立基准测试公司 Artificial Analysis 测得的 Cerebras 速度超过 2,500 TPS/用户,是 Nvidia 旗舰解决方案性能的两倍多。
“Cerebras 打破了 NVIDIA 上周创下的 Llama 4 Maverick 推理速度记录,”Artificial Analysis 联合创始人兼首席执行官 Micah Hill-Smith 说。“人工分析以每秒 2522 个令牌的速度对 Cerebras 的 Llama 4 Maverick 终端节点进行了基准测试,而同一型号的 NVIDIA Blackwell 每秒 1038 个令牌。我们已经测试了数十家供应商,Cerebras 是唯一优于 Blackwell 的 Meta 旗舰模型的推理解决方案。
凭借今天的结果,Cerebras 在 400B 参数 Llama 4 Maverick 模型上创下了 LLM 推理速度的世界纪录,该模型是 Llama 4 系列中最大、功能最强大的模型。人工分析测试了其他多家供应商,结果如下:SambaNova 794 t/s、Amazon 290 t/s、Groq 549 t/s、Google 125 t/s 和 Microsoft Azure 54 t/s。
Cerebras Systems 首席执行官 Andrew Feldman 表示:“当今企业中部署的最重要的 AI 应用程序(代理、代码生成和复杂推理)都受到推理延迟的瓶颈。这些使用案例通常涉及多步骤思维链或大规模检索和规划,GPU 上的生成速度低至每秒 100 个令牌,导致等待时间长达几分钟,使生产部署不切实际。Cerebras 率先重新定义了 Llama、DeepSeek 和 Qwen 等模型的推理性能,经常提供超过 2500 TPS/用户。
凭借其创世界纪录的性能,Cerebras 是 Llama 4 在任何部署场景中的最佳解决方案。Cerebras Inference 不仅是第一个也是唯一一个在该模型上打破 2,500 TPS/用户里程碑的 API,而且与人工分析基准测试中使用的 Nvidia Blackwell 不同,Cerebras 硬件和 API 现已推出。Nvidia 使用了大多数用户无法使用的自定义软件优化。有趣的是,Nvidia 的推理提供商都没有提供 Nvidia 公布的性能的服务。这表明,为了实现 1000 TPS/用户,Nvidia 被迫通过批处理大小 1 或 2 来降低吞吐量,使 GPU 的利用率低于 1%。另一方面,Cerebras 在没有任何特殊内核优化的情况下实现了这一破纪录的性能,并且即将通过 Meta 即将推出的 API 服务提供给所有人。
对于推理、语音和代理工作流等尖端 AI 应用程序,速度至关重要。这些 AI 应用程序通过在推理过程中处理更多令牌来获得智能。这也会使他们变慢并迫使客户等待。当客户被迫等待时,他们会离开并转向提供更快答案的竞争对手——这是 Google 十多年前在搜索中展示的发现。
凭借创纪录的性能,Cerebras 硬件和由此产生的 API 服务是全球开发人员和企业 AI 用户的最佳选择。
免责声明:
本文《Cerebras 以最快的 Llama 4 Maverick 性能引领 LLM 推理竞赛》版权归原作者所有,内容不代表本站立场!
如本文内容影响到您的合法权益(含文章中内容、图片等),请及时联系本站,我们会及时删除处理。
推荐阅读

Web3游戏王来袭? Konami合作AVAX开发商Ava Labs推NFT平台Resella
OJD数字认知网 - 区块链数字货币实时行情平台天本游戏巨头Konami Digital Entertainment(下称Konami),在2023年9月的东京电玩展(TGS2023)上,宣布将推出N...
阅读: 51

数字艺术家Beeple将举办Pepe艺术展!提交作品有望获得免费门票
MF1数字认知网 - 区块链数字货币实时行情平台美国知名数字艺术家Beeple,将在8月10日于南卡罗来纳州的Charleston举办Pepe艺术展!并公开募集艺术品,入选者将可获得活动免费门票!MF...
阅读: 63

OpenSea要求美国SEC厘清:NFT市场不是交易所或经纪商
mnn数字认知网 - 区块链数字货币实时行情平台美国NFT龙头平台OpenSea正式向监管机关喊话,要求美国证管会(SEC)明确表态:NFT市场不应被纳入 联邦证券法中的「交易所」或「经纪商」定义范畴...
阅读: 30

一文了解Ubisoft搞NFT、链游失败?分割旗下刺客信条三大IP设子公司 腾讯入股12.5亿美
Kkh数字认知网 - 区块链数字货币实时行情平台加拿大游戏大厂育碧Ubisoft今(28)宣布成立专责《刺客信条》、《极地战嚎》、《虹彩六号》三大新子公司,目的是为了获取由腾讯腾讯11.6亿欧元巨额投...
阅读: 63

美国司法部深入调查泰达币:1:1美元储备再遭质疑,投资者如何避险?
数字认知网报道:u7n数字认知网 - 区块链数字货币实时行情平台近期,美国司法部对泰达币展开了深入调查,这一消息在加密货币市场引起了轩然大波。泰达币作为全球最大的稳定币之一,一直宣称与美元保持1:1的...
阅读: 33

2024年十大泰达币骗局揭秘:十万元血本无归背后隐藏哪些陷阱?
数字认知网报道:lym数字认知网 - 区块链数字货币实时行情平台在2024年的加密货币市场中,泰达币骗局呈现出愈演愈烈的态势。随着加密货币的热度不断攀升,越来越多的投资者将目光投向了泰达币。然而,不法...
阅读: 37

泰达币再陷信任危机:最新法律调查与储备金透明度报告深度解析
数字认知网报道:vLN数字认知网 - 区块链数字货币实时行情平台泰达币再陷信任危机:最新法律调查与储备金透明度报告深度解析泰达币(USDT)作为加密货币市场中颇具影响力的稳定币,长期以来在市场交易中扮...
阅读: 53

2025年瑞波币释放计划曝光:每月10亿XRP流入市场将如何影响未来价格走势?
数字认知网报道:XoR数字认知网 - 区块链数字货币实时行情平台2025年瑞波币释放计划影响分析近期,加密货币市场被一则重磅消息所震动,2025年瑞波币(XRP)的释放计划曝光,每月将有10亿XRP流...
阅读: 18

SEC诉讼案现重大转机!瑞波币合规化进程加速,2026年能否突破历史峰值?
数字认知网报道:Eyi数字认知网 - 区块链数字货币实时行情平台SEC诉讼案现重大转机!瑞波币合规化进程加速,2026年能否突破历史峰值?在数字货币的世界里,瑞波币一直是备受关注的焦点之一。然而,自美...
阅读: 27

跨境支付革命2.0时代:瑞波币3秒到账技术如何抢占万亿美元市场份额?
数字认知网报道:NTs数字认知网 - 区块链数字货币实时行情平台跨境支付革命2.0时代:瑞波币3秒到账技术如何抢占万亿美元市场份额?在全球化的浪潮下,跨境支付的需求呈现出爆发式增长。传统的跨境支付方式...
阅读: 53
猜你喜欢

投资5000美元购买Cardano,15年后可能获得怎样的回报?
2025-11-04

狗狗币进军主流市场——体育场和球衣都换上了加密货币主题的服装
2025-11-04

今日比特币新闻:比特币11万美元十字路口:突破还是熊市回调?
2025-11-04

1.5亿美元资产冻结,144亿美元比特币流向——陈志加密货币丑闻内幕
2025-11-04

罗伯特·清崎选择比特币和以太坊作为抵御大规模崩盘的盾牌
2025-11-04

美国商品期货交易委员会新领导层及其对美国加密货币市场主导地位的影响
2025-11-04
