(来源:中国政府采购报)
转自:中国政府采购报
【圆桌论坛·大模型应用全景扫描】
编者按:当政务大模型加速融入政务服务与行业实践,“成本”成为绕不开的核心议题。面对政务场景的特殊性与预算规范要求,如何构建兼顾安全需求、使用灵活性与成本平衡的收费模式,让大模型的价值落地既符合财力要求,又能真正服务于政务效率提升?本期圆桌论坛,业内专家将围绕这些焦点展开深度探讨。
主持人:
本报记者 张明柳
嘉宾:
博思数采科技股份有限公司副总裁 陈 旭
国泰新点软件股份有限公司副总裁 何永龙
浪潮云总经理助理 陈 尧
采招云数智化采购研究中心 宋 军
用得起更要用得好
——业内专家共话如何以合理成本撬动大模型高效应用
主持人:开源不等于免费,以DeepSeek为代表的开源大模型的低成本体现在哪些方面?
何永龙:DeepSeek在训练成本上的优势显著,摒弃了传统大模型“暴力堆料”式的训练资源消耗模式。采用高效的模型蒸馏复用技术,将从大型基础模型中提取的关键知识应用到招标采购领域的专项训练,减少了从零训练所需的海量数据和算力投入。同时,通过智能的数据筛选和增量学习方式,精准选取与行业相关的高质量数据进行训练,有效降低了数据预处理与标注成本。例如,在处理政策法规更新时,只需针对变化部分进行训练,而非对整个模型重新训练,大幅提升了训练效率,降低了训练成本。
陈旭:在推理阶段,DeepSeek的混合专家模式(MoE)架构仅调用最相关的小部分模型参数,大幅缩减每次推理的计算开销。这意味着单次推理所需算力和显存占用大幅降低,服务器可用更少GPU或更低功耗完成相同推理任务。DeepSeek还通过模型压缩技术进一步降低部署成本。官方开源了多种不同规模的模型(如1.5亿、7亿、14亿、70亿参数等)供开发者按需使用。这些小模型通过剪枝或蒸馏自大模型而来,去除了冗余参数,保留关键知识,使模型体积大幅缩小而性能接近。剪枝后的轻量模型不仅降低推理时的内存和计算需求,还能在资源受限环境下实现流畅运行。例如,有些设备只支持参数量较小的蒸馏版DeepSeek模型,即通过剪裁精简从而适配单机部署。这种按需裁剪的形式让不同算力条件的用户都能以更低成本使用DeepSeek,大幅减少了运行维护的负担。
陈尧:DeepSeek深度进行算法与硬件的协同设计,充分利用GPU特性,采用FP8进行训练,大幅提高了资源利用率,降低了成本。DeepSeek R1模型通过纯强化学习(RL)训练,无须提供显式思维链数据,而是通过奖励机制引导模型自我演化。这种训练方式减少了人工标注数据的依赖,降低了数据准备和微调成本。
宋军:DeepSeek在推理阶段采用了多头潜在注意力(MLA)技术,通过压缩注意力机制中的键和值,有效减少了计算量。这种技术显著提高了模型的运行效率,降低了推理成本。在推理芯片的优化选择上,DeepSeek R1模型将单次推理的能耗压缩至竞品的1/30。合理选择适合DeepSeek大模型的GPU,使其显存和带宽、算力匹配更适合DeepSeek R1模型的需求。低成本高效算力卡的选择使得推理成本大幅降低。
主持人:DeepSeek的较低成本对政务和各行业的AI应用落地具有怎样的促进作用?
陈旭:DeepSeek显著降低了大模型使用成本,对政务和各行业的AI应用落地具有积极促进作用。
首先,研发成本的下降让中小型企业和政府机构有能力训练或定制大模型,不再只有科技巨头才能承担相关投入。DeepSeek开源权重和低硬件需求,使得科研院所、行业龙头甚至初创团队都可利用其模型进行二次开发,在垂直领域构建定制AI服务,加速了AI在政务、金融、医疗、制造等行业的落地进程。
其次,推理成本的降低意味着部署和运行大模型的日常开销大幅减少。对于政务应用,如政务服务问答、智慧城市决策支持等,采用DeepSeek可以以可控的预算长期运行AI助手,无须昂贵的云服务开支。这降低了公共部门引入AI系统的财政门槛。
再次,低成本使本地化部署成为现实,政府和企业能够将模型部署在内网或国产硬件上,保障数据主权和安全合规。许多政府机构对数据隐私要求严格,DeepSeek的低成本本地方案使他们无须依赖第三方云即可享受大模型智能,从而更愿意将其引入实际业务。
最后,低成本带来的门槛降低将推动大模型应用的普及:越来越多行业用户可以负担得起AI模型,将其嵌入生产流程,提高效率和决策能力。这种大规模的应用扩展又将反过来创造更多训练数据和应用需求,形成良性循环。可以预见,在DeepSeek开启的低成本范式下,政务和各行业将更快、更广泛地落地大模型应用,实现智能化升级。
宋军:DeepSeek的较低成本对政务及各行业AI应用落地的促进作用主要体现在开源生态、开放硬件支持等核心优势上,这些因素共同降低了技术应用门槛,加速了场景化创新落地。
开源策略显著降低开发成本。DeepSeek通过开源模型和工具链,允许政府及企业直接利用预训练模型进行二次开发,避免从零构建算法的资源投入。例如,医疗行业可基于开源框架快速开发病历分析模块,教育部门可定制智能辅导系统。开源社区还能推动技术迭代,形成产学研协作生态,进一步压缩研发周期与成本。
开放硬件支持提升部署灵活性。DeepSeek兼容各种芯片及通用GPU,用户可根据预算选择硬件方案,避免被特定厂商绑定。例如,地方政府在财力紧张情况下可采用性价比更高的硬件部署AI政务助手,而企业可通过混合算力方案平衡性能与成本。
这些核心优势最终转化为对AI应用落地的多重促进作用,具体体现在三方面:一是加速普惠化应用。低成本让中小企业和基层政府也能接入AI,如县域农业部门利用定制模型实现病虫害识别。二是激发行业创新。二次开发门槛降低后,垂直领域可深度挖掘场景潜力,如法律AI衍生合同审查、案件预测等细分功能。三是深化生态协同效应。“开源+开放硬件”形成正向循环,吸引更多开发者与行业伙伴加入,推动AI生态繁荣。
主持人:对于政务领域应用,采用什么样的收费模式比较合理?如何平衡成本与价值,既能满足政务用户需求,又能符合预算管理和性价比要求?
陈旭:在政务大模型应用中,选择合理收费模式是关键。不同层级政务客户需求不同,中央机关适合私有部署加维护费,地方政府可按年订阅,事业单位通用场景用SaaS订阅、敏感业务本地部署。收费策略有SaaS订阅、私有化部署、API调用和混合模式。SaaS订阅成本低但需解决安全问题,私有化部署数据可控但投入大,API调用适合小规模试用,混合模式可降低成本。
政府采购流程和预算机制要求定价规范透明。厂商需契合年度预算周期,采用按年收费或多年折扣的方式开展。公开招标项目报价要考虑竞争,框架协议采购需标准化定价,小额项目可先试点。
陈尧:在政务领域应用中,收费模式的合理设计需兼顾公共服务的公益性、成本回收的可行性以及用户体验的便捷性。政务领域收费模式需跳出传统IT项目的“一次性采购”思维,转向“持续服务+价值共享”的范式,采用“服务订阅”收费模式更加合理,用户可根据需求及预算,灵活选取任意产品,后续可根据业务需求进行动态扩容或场景变更,按使用量或使用周期收费,降低用户的成本投入压力,实现成本与价值的平衡。
创新性收费策略可以采用“政府买设备、企业投配套、收取服务费”的创新模式,政企双方基于各自优势进行差异化分工,形成互补。一是借助设备采购补贴政策,降低地区财政压力及避免全部由企业投入的前期资金占用压力;二是其余配套(如智算设备、大模型、云平台、网络安全设备等)由企业预投,进一步降低财政压力。
此外,还可以深化政府和企业合作机制,通过资源整合、风险共担、优势互补,降低双方成本投入及运营风险,通过联合运营提升服务效率及质量,推动产业升级,打造“1+1>2”的效果,实现政企双赢。
本报拥有此文版权,若需转载或复制,请注明来源于中国政府采购报,标注作者,并保持文章的完整性。否则,将追究法律责任。
上一篇:寒武纪股价突破1000元大关!