DeepSeek于知乎开设官方账号 首次公布模型推理系统优化细节
创始人
2025-03-01 18:16:57

3月1日消息,DeepSeek于知乎开设官方账号,独家发布《DeepSeek-V3/R1推理系统概览》技术文章,首次公布模型推理系统优化细节,并披露成本利润率关键信息,标志着全球关注的“DeepSeek开源周”正式收官。

据介绍,知乎一直是AI从业者和创业者密度最高的社区,此次DeepSeek选择知乎作为开源发布的最后一站,进一步引领了全网最重要的AI趋势发布。

作为“DeepSeek开源周”的收官之作,DeepSeeK知乎官方账号正式亮相,并发布文章详述V3/R1推理系统。文章写道:“DeepSeek-V3 / R1推理系统的优化目标是:更大的吞吐,更低的延迟。”为实现这两个目标,DeepSeek的方案是使用大规模跨节点专家并行(EP),但该方案也增加了系统复杂性。文章的主要内容就是关于如何使用EP增长批量大小(batch size)、隐藏传输耗时以及进行负载均衡。

值得一提的是,文章还率先披露了DeepSeek的成本和利润率等关键信息。“假定GPU租赁成本为2美金/小时,总成本为$87,072/天。……如果所有 tokens全部按照DeepSeek R1的定价计算,理论上一天的总收入为$562,027,成本利润率545%。”

据了解,“DeepSeek开源周”自2月24日至2月28日,陆续开源最新技术进展。其中包括,FlashMLA、DeepEP、DeepGEMM和3FS四个开源项目,以及DualPipe、EPLB等代码库。每一项开源发布,都在知乎引发了业内人士的热烈讨论。(定西)

相关内容

热门资讯

加拿大强烈反对美国加征关税 【#加拿大强烈反对美国加征关税#】#加拿大就格陵兰岛表态# 据新华社,加拿大总理卡尼20日在瑞士达沃...
城市表情 冰趣 (来源:千龙网)时间:1月20日地点:什刹海冰场场景:一位游客推着冰车开心奔跑。新京报记者 薛珺 摄
非机动车越线等灯依然普遍   实习记者 刘玉洁 本报记者 孙宏阳  红灯停,该停在哪?自然是路口停止线后。然而,不少骑行人仍未...
2025年甘肃经济向上向好 瓜州县境内一条条“高速公路”将电力输送至全国多地。新甘肃·甘肃日报记者 高樯 田蹊 2025年...
随采随传随检,血液标本50秒“... (来源:河北日报)转自:河北日报随采随传随检,血液标本50秒“飞”到检验科 1月8日,在河北医...