理论成本利润率545%!DeepSeek知乎发文引业内震动
创始人
2025-03-01 21:56:01
图片来源:界面图库

3月1日,DeepSeek官方认证账号在知乎发布了《DeepSeek-V3/R1推理系统概览》(下称《概览》)一文,首次公布模型推理系统的核心优化方案,并披露理论成本利润率高达545%,刷新了全球AI大模型领域的盈利高点,引发业内震动。

《概览》显示,DeepSeek-V3/R1推理系统的优化目标是更大的吞吐、更低的延迟。

为了实现上述两个目标,DeepSeek使用大规模跨节点专家并行(EP)。首先EP使得批量尺寸大大增加,从而提高图形处理器(GPU)矩阵乘法的效率,提高吞吐。其次 EP 使得专家分散在不同的 GPU上,每个GPU只需要计算很少的专家,因此更少的访存需求,从而降低延迟。

EP同时也增加了系统的复杂性。因此,《概览》就如何使用EP增大批量尺寸、如何隐藏传输的耗时、如何进行负载均衡等进行了讲解。

DeepSeek还披露了DeepSeek的理论成本和利润率等关键信息。

文章称,在北京时间2月27日12:00 至2月28日12:00,DeepSeekV3和R1推理服务占用节点总和,峰值占用为278个节点,平均占用226.75个节点(每个节点为8 个H800 GPU)。假定GPU租赁成本为2美元/小时,总成本约为8.71万美元/天。

如果所有tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入大约56.20万美元,成本利润率为545%。

图片来源:《DeepSeek-V3/R1 推理系统概览》

DeepSeek此次披露的数据,不仅验证了其技术路线的商业可行性,也预示着AI大模型的盈利闭环已从理想照进现实。此前发布的DeepSeek-V3模型训练成本仅557.6万美元,是同类产品的1%-5%。

DeepSeek此次在知乎发布《概览》,引来近600条评论、5000多点赞。有网友称,今日发布的《概览》技术文章是“开源周彩蛋”,直接亮出了底牌。有网友称赞:“太强了,AI算力成为水电的基础是要足够便宜,Deepseek迈出了一大步”。

《概览》发布也标志着全球关注的“DeepSeek开源周”正式收官。“DeepSeek开源周”自2月24日至2月28日,陆续开源最新技术进展。其中,包括FlashMLA、DeepEP、DeepGEMM和3FS四个开源项目,以及DualPipe、EPLB等代码库。

相关内容

热门资讯

浙江帕瓦新能源股份有限公司 2...   证券代码:688184          证券简称:ST帕瓦(维权)         公告编号:...
晨读|沈静:你丢了纸质书吗? (来源:上观新闻)我只看纸质书。虽然它笨重麻烦,它占空间,它颇费钱,可你还是爱它,一如既往,此份钟意...
辽宁酒店预订同比增82% 一组组鲜活数据,映照出沈阳这座城市新年旅游市场的强劲开局。 沈阳文旅供图
雪落西界时 (来源:中国旅游报)转自:中国旅游报   □ 胡 英  清晨,风裹着冬日的清冽扑面而来。家对面的西界...
【开源掘金新三板】高质量扩容:... (来源:诸海滨新三板)· 新三板筑牢“塔基”与沪深北港四大交易所共同服务中小企业中国资本市场已形成了...