DeepSeek驱动国产算力景气周期
创始人
2025-04-03 06:07:06

转自:南京晨报

人工智能的发展可以划分为四个阶段:感知AI、生成式AI、代理式AI及物理AI。南京证券研究员孙其默表示,所谓的感知AI,是人工智能的初始阶段,让机器具有感知能力。核心技术包括:机器视觉技术、语音识别、自然语言处理等技术。这一阶段,使得AI有了接收和识别的能力,但缺乏对信息的深入理解。

第二阶段,也就是生成式AI,大家比较熟悉的ChatGPT、Google Gemini以及国内的DeepSeek,都是具有代表性的产品。生成式AI能够创造新的内容,通过大模型学习,生成类似但独特的内容。生成式AI已经融入人们日常生活,GhatGPT周用户量已经达到3亿,DeepSeek推出之后推理成本下降进一步推动应用落地。第三个阶段是代理式AI,这是一种能够自主完成任务的人工指挥系统。代理式AI的核心组件,包括模型、工具以及协调层。模型负责决策,工具让代理和外界世界互动,而协调层则管理代理的推理和行动循环。代理式 AI 就像是一个能自己思考、自己动手做事的 AI 助手,它会根据用户的需求,自动选择的工具和方法来完成任务。之前出圈的Manus AI就是这样的工具,让用户从繁琐、重复性较高的工作或生活中得到解脱,更专注于创造性的事项。第四个阶段物理AI,是指具有物理行动能力的人工智能系统,能够与现实世界进行互通。具身智能也就是物理AI最具有代表性的产品。

从推理的角度来看,相较于生成式AI一问一答的形式,代理式AI的长思维链推理能力对于算力的需求是更高的。

生成式AI改变了计算方式,从检索式计算模型变成了生成式计算模型。之前所有工作都是预想创建内容,存储多个版本,在有需要时去获取相应的版本。但生成式AI可以理解上下文,并生成它所理解和知道的内容。而对于代理式AI,长思维链推理成为关键,它可以访问网站,查看多模态信息,推理时间与信息复杂度显著提高。物理AI则需要理解物理世界,物理三维世界所包含的信息更加复杂,AI与现实世界交互对于准确度、安全性要求更高。

孙其默表示,在模型架构上,DeepSeek-V3采用稀疏混合专家模型(MoE)、多头潜在注意力机制(MLA)等技术,减少模型冗余,提高模型计算效率,降低成本。在训练架构上,通过DeepSeek软硬件协同能力,采用多种多并行策略、FP8混合精度训练框架等技术,充分挖掘英伟达算力芯片性能,有效降低模型训练综合成本。

训练时代下,北美云厂商抢先大笔投入布局算力基础设施以满足基础大模型算力需求。在推理时代下,国内互联网厂商在训练、推理成本下行的背景下,为满足自身庞大客户推理需求,将加速国内算力基础设施建设,国产算力产业链将进入景气周期。

(以上内容仅供参考,不作为投资决策依据。投资有风险,入市需谨慎。)

南京晨报/爱南京记者 许崇静

相关内容

热门资讯

垂直发射系统——军舰上的“导弹... 德国萨克森级护卫舰上的Mk41垂直发射系统发射“海麻雀”导弹瞬间。现代海军舰艇最引人注目的特征之一,...
智谱股价飙升24%,外国网友直... 智谱(2513.HK)今日重拾升势,盘中股价一度飙升24.64%,报698港元。智谱于2月12日正式...
摩尔线程涨2.13%,成交额6... 2月24日,摩尔线程盘中上涨2.13%,截至13:10,报587.75元/股,成交6.05亿元,换手...
国内某著名半导体企业员工,离职... 财联社2月24日讯,据最高人民检察院网站,最高人民检察院知识产权检察厅副厅长刘太宗做客“学思践悟党的...
中煤能源股价涨5.06%,广发... 2月24日,中煤能源涨5.06%,截至发稿,报15.15元/股,成交4.82亿元,换手率0.35%,...