DeepSeek最新发声
创始人
2025-03-02 00:02:43

3月1日,DeepSeek在知乎官方账号发布题为《DeepSeek-V3/R1推理系统概览》的文章。

文章披露了DeepSeek-V3/R1推理系统采用大规模跨节点专家并行(EP)技术来实现更大的吞吐和更低的延迟。为提升整个系统效率和GPU利用率,DeepSeek尽可能地为每个GPU分配均衡的计算负载、通信负载。

文章还披露了DeepSeek的成本、利润等关键信息。

DeepSeek-V3和R1的所有服务均使用H800 GPU。由于服务负荷白天高、晚上低,DeepSeek实现一套机制,在白天负荷高的时候用所有节点部署推理服务,晚上负荷低的时候减少推理节点。

2月27日至2月28日的24个小时内,DeepSeek-V3和R1推理服务占用节点总和,峰值占用为278个节点,平均占用226.75个节点(每个节点为8个H800 GPU)。假定GPU租赁成本为2美元/小时,总成本为87072美元/天。

若所有tokens的输入和输出全部按照DeepSeek R1的定价计算,理论上DeepSeek一天的总收入为562027美元,成本利润率高达545%。不过,由于DeepSeek-V3定价低于R1,且网页端和应用程序免费,仅部分服务产生收入,再加上非高峰时段设有夜间折扣,其实际收入不及理论数值。

2月26日,DeepSeek在官网宣布,北京时间每日00:30至08:30的夜间空闲时段,DeepSeek开放平台推出错峰优惠活动。在此期间,API调用价格大幅下调:DeepSeek-V3降至原价的50%,DeepSeek-R1更是低至25%。DeepSeek称,鼓励用户充分利用这一时段享受更经济更流畅的服务体验。

“DeepSeek开源周”自2月24日启动,期间DeepSeek陆续开源了众多最新技术进展,包括FlashMLA、DeepEP、DeepGEMM和3FS四个开源项目以及DualPipe、EPLB等代码库。这些开源成果在业内引发了热烈讨论。

相关内容

热门资讯

三千公里山海相约 闽藏共兴藏药... 跨越3000公里,西藏昌都市代表团今年如约而至,以“红色昌都入闽·共绘山海蓝图”为主题亮相海创会,近...
视频 | 佛得角门将母亲将现场... 首次踏上世界杯赛场的佛得角队以0:0逼平夺冠热门西班牙队,门将沃西尼亚立下大功。赛后,这位40岁“老...
榕江县最新或2023(历届)征... 7月4日,贵州榕江县征兵工作会议召开,标志着全县夏秋征兵工作正式启动。 根据国家、成都军区和省...
遵义市最新或2023(历届)征...  从起,全国征兵时间统一由冬季调整到夏秋季,目前正在进行网上报名。遵义市征兵工作共分为集中报名、体检...
贵州省政府办公厅与省军区司令部...   经省人民政府和省军区同意,省政府办公厅和省军区司令部7月10日共同印发了《贵州省学校征兵工作暂行...