联想宣布旗下首款AMD AI服务器单机部署满血版DeepSeek大模型,可实现极限吞吐量6708 token/s
创始人
2025-03-17 14:17:19

  Hehson科技讯 3月17日下午消息,联想宣布旗下首款AMD AI大模型训练服务器联想问天WA7785a G3在单机部署671B(满血版) DeepSeek大模型时,可实现极限吞吐量6708token/s,将单台服务器运行大模型的性能推向了新高。

  依托联想万全异构智算平台,联想通过访存优化、显存优化、PCIe 5.0全互联架构创新以及精选SGLang框架中性能最优算子等诸多创新方式,对大模型从预训练、后训练到推理的全流程进行持续优化,在单台部署DeepSeek 671B大模型的联想问天WA7785a G3上实测最高吞吐量达6708 token/s。

  在模拟问题对话场景(上下文序列长度128/1K)时,最高可支持并发数158,TPOT 93毫秒, TTFT 2.01秒;而在模拟代码生成(上下文序列长度512/4K )时,并发数可达140,TPOT 100毫秒, TTFT 5.53秒。这一成绩意味着单台联想问天WA7785a G3可以支撑1500人规模企业的正常使用,是继联想问天WA7780 G3服务器单机部署满血版DeepSeek 大模型总吞吐量突破2500 token/s之后,单机部署该大模型推理性能的又一次突破。

  联想方面称,此次突破是联想中国基础设施业务群、联想研究院ICI实验室和AMD联合设计、协同调优、共同实现的。此结果也并非最终结果, 联想与AMD 还在持续尝试深度调优新方法,实现更高调优突破。

相关内容

热门资讯

吕蒙到底是怎么死的 事实真的是... 看过三国演义的朋友都知道,孙权夺取荆州之后,斩杀关羽,大摆筵席庆祝,席上,第一功臣吕蒙被关羽附体,大...
创意搞笑的情人节祝福语大全 情...   夜深了!无数的星辰亮起,当流星划过时,就能将我的思念与祝福传送给你!情人节到了,愿我的情可以由满...
最新或2023(历届)给女朋友... 着你,所以每天积攒米,终于攒够一袋米,粒粒都在爱着你,愿你越来越美丽,一生相携不离也不弃!  像朋友...
最新或2023(历届)情人节给... ,但在最累时仍甜密地想起你;我有时可能很懒,但在最懒时仍会发短信给你,祝你情人节开心!  我有一点动...
创意的情人节祝福语大全-情人节... ,我羡慕月亮,她能注视着你安祥地入睡,我羡慕自己,因为我可以时刻想念你。  20、钻石恒久远,一颗永...