英伟达Blackwell GPU突破AI算力瓶颈,实现 1000 TPS/User里程碑
创始人
2025-05-24 13:01:42

IT之家 5 月 24 日消息,当地时间周四,英伟达宣布其 Blackwell GPU 在 4000 亿参数的 MetaLlama 4 Maverick 模型上成功打破了 LLM 推理速度世界纪录。

据介绍,AI 基准测试机构 Artificial Analysis 通过配置 8 块 Blackwell GPU 的 DGX B200 节点,首次实现每用户每秒生成 1000 个 token(TPS)的性能里程碑。

英伟达表示,技术团队通过 TensorRT-LLM 软件栈实施深度优化,并采用 EAGLE-3 技术训练推测解码草稿模型,使其性能较优化前基准提升 4 倍。整套服务器系统在峰值吞吐配置下可达每秒 72,000 token。

英伟达解释称:“推测解码是通过小型快速草稿模型预测 token 序列,再由大型目标 LLM 并行验证的加速技术。其优势在于单次迭代可能生成多个 token,代价是额外的草稿模型计算开销。”

为实现该突破,工程师团队采用基于 EAGLE3 的软件架构。该架构专为大型语言模型推理加速设计,与 GPU 硬件架构形成协同效应。IT之家注意到,测试结果显示 Blackwell 架构已完全适配 Llama 4 Maverick 级别的超大规模语言模型。

英伟达还表示,他们在保持响应准确性的同时大幅提高了性能。在许多指标上,使用 FP8 数据格式的准确性与人工分析 BF16 相当。

相关内容

热门资讯

“大思政课”多元形式传承红色薪... 聚焦吴石精神 演绎英烈故事 “大思政课”多元形式传承红色薪火 林晓艳引入机器人推演“赴台九死一生...
“成都女子家门口遇害案”宣判,... 2025年12月20日,四川省成都市中级人民法院一审公开宣判被告人梁某滢故意杀人一案,对被告人梁某滢...
爱泼斯坦公开文件被大量涂黑 【#爱泼斯坦公开文件被大量涂黑#】#克林顿方面怒斥被当替罪羊#美国司法部19日开始在其网站公布已故富...
2025年上汽名爵MG欧洲销量...   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! (来源:IT之家)I...
美军宣称暗鹰导弹射程3500公... (来源:环球时报)转自:环球时报 【#美军宣称暗鹰导弹射...