(来源:新华日报)
□ 吴 斌
人工智能是引领新一轮科技革命和产业变革的重要驱动力,正深刻改变着人们的生产、生活、学习方式,推动人类社会迎来人机协同、跨界融合、共创分享的智能时代。数据是人工智能的“血液”和“燃料”,其规模、质量及利用效率直接决定了人工智能发展的深度与广度。当前我国人工智能产业链仍面临着受制于人的严峻风险,数据孤岛与算力瓶颈成为制约我国AI产业向上突围的隐形锁链。在此背景下,激活并高效利用我国得天独厚的工业数据资源,将其转化为提升产业链韧性的核心动能,已然成为一项刻不容缓的重大任务。
当前,人工智能大模型的训练正面临一个日益严峻的挑战:高质量数据的枯竭。研究机构Epoch AI预测,用于训练AI模型的典型数据集规模将于2028年触及公共在线文本总量的上限。这意味着,依赖传统网络公开数据的模型训练路径将遭遇瓶颈。与此同时,我国坐拥一座尚未被充分开采的“数据富矿”——海量工业数据。据工信部统计,2024年全国数据生产总量达41.06ZB,同比增长25%,增速持续提升。这些海量、多维、真实的工业数据,源自企业生产、运营、管理、服务等全流程,是训练和优化面向产业实践的AI模型不可替代的宝贵资源,是提升产业链韧性的关键支撑。
然而,这座“富矿”在当前的AI大模型训练中尚未得到充分应用。一方面,工业数据往往分散、封闭或格式不统一,难以有效汇聚利用;另一方面,其价值尚未被充分认知并转化为模型训练的“营养基”。因此,面对通用数据源的枯竭趋势和工业数据的巨大潜能,我们必须高度重视对我国工业数据的有效保护和高效利用。目前,激活工业数据潜能,建立安全、合规、高效的数据流通与应用机制,已成为强化我国AI产业链自主可控能力、抢占未来发展制高点的关键突破口。
工业数据赋能人工智能产业链的多维价值
锻造智能基座,训练更强大的垂直领域工业大模型。目前,通用大模型在处理特定工业场景时往往力不从心。利用覆盖研发设计、工艺优化、生产控制、质量检测、设备运维、供应链管理等全链条的工业场景数据,可针对性训练出理解工业语言、深谙行业Know-how的垂直领域大模型。例如,利用海量设备运行参数、工况数据与故障记录,可训练出预测性维护模型,大幅降低非计划停机风险;利用产品设计图纸、仿真数据、材料性能与测试反馈,可训练出辅助研发创新的设计模型,加速产品迭代。这些扎根于工业土壤的专用模型,是提升核心环节自主可控能力、应对供应链波动的关键工具。
赋能工业之魂,驱动国产工业软件的智能化跃升。工业数据是优化和验证工业软件算法、提升其智能化水平的基石。一方面,利用产线上实时采集的加工数据(如切削参数、振动、温度)与产品质量数据,可迭代升级国产工业软件的工艺参数优化模块,使其设计方案更贴合实际设备能力与材料特性。另一方面,将实际生产环境中积累的复杂工况数据注入国产CAD/CAM/CAE等仿真软件,可提升仿真结果的置信度,减少对昂贵物理试验的依赖,加速国产替代进程。
洞察全局脉络,增强产业链协同与风险预警能力。工业数据蕴含产业链上下游的订单、库存、物流、产能、质量等丰富信息。借助人工智能进行深度关联分析,构建起产业链全链路可视化生产,不仅能实现更精准的需求预测和产能协同,更能敏锐捕捉潜在的断供风险,为提前部署替代方案、调整生产计划、优化库存策略提供智能决策支持,提升整个链条应对外部冲击的韧性。
工业数据提升人工智能产业链韧性的实施路径
筑牢工业数据安全屏障,创新数据治理技术体系。提升工业数据战略定位,强化工业数据主权意识。将工业数据纳入国家战略资源管理体系,参照稀土资源管控模式建立分级保护机制,重点推进《工业数据分类分级指南》等标准规范的推广应用,完善确权授权、安全防护、质量评估三位一体的制度框架。推动工业数据安全认证体系在东盟、中东欧等“一带一路”合作区域落地,积极参与ISO、IEC、ITU等国际组织数据安全标准制定,争取主导权。推动工业企业建立首席数据官(CDO)制度,统筹内部数据管理。探索基于区块链、隐私计算等技术的数据存证与可信流通机制,在保障数据主权和安全的前提下破除“数据孤岛”“数据烟囱”。推广工业数据空间、联邦学习等新型架构理念,实现数据“可用不可见”“可控可计量”的共享利用。
打造多层次、高效率的工业数据要素市场与共享平台。鼓励建设区域级、行业级的工业大数据中心或公共平台,提供数据汇聚、清洗、标注、脱敏、托管、交易等基础服务。探索“数据银行”“数据信托”等创新模式,平衡各方权益,激励数据供给。支持发展专业化的工业数据经纪商和服务商,撮合数据供需。政府推动重点产业链、先进制造业集群建立数据共享联盟或“数据池”,以具体场景(如供应链协同、共性技术研发)为牵引,推动数据在联盟成员间合规高效流动。
推动工业智能算力基础设施普惠化与协同化。大模型训练与复杂工业数据分析对算力需求巨大,需统筹布局面向工业领域的智算中心、超算中心和边缘计算节点,构建“云边端”协同、算网融合的基础设施。鼓励建设行业或区域共享的工业算力服务平台,降低中小企业获取高性能算力的门槛。推动算力资源与工业互联网平台、工业数据平台深度融合,提供“数据+算力+工具”的一体化服务。
推动人工智能与工业融合及场景创新。设立专项资金,支持在重点行业(如装备制造、电子信息、新材料、新能源)打造数据驱动提升产业链韧性的标杆场景,如优化排产、预测性维护、工艺优化、数字孪生等。鼓励“链主”企业开放场景,联合AI企业、科研院所进行联合攻关,形成可复制推广的解决方案。
强化复合型人才供给与创新生态培育。大力培养既懂工业机理、业务流程,又精通数据科学、AI算法的复合型人才。推动高校、职业院校与龙头企业合作,共建现代产业学院、特色化示范性软件学院。鼓励科研机构聚焦工业数据价值挖掘的基础理论与关键技术(如小样本学习、迁移学习、增量学习)进行攻关。营造有利于数据驱动创新的政策环境,完善知识产权保护,激发各类主体活力。
工业数据的价值不在沉睡的字节中,而在流动、碰撞、融合后催生的智能决策与产业韧性之中。唯有将工业数据这一战略资源置于核心地位,以系统性思维破除壁垒、激活要素、深化应用,方能锻造出“数据强筋、AI壮骨”的现代产业链体系。当工业数据的洪流奔腾于中国制造的血脉,人工智能产业链便有了最深厚的根基与最澎湃的动力。
(作者为南京工业大学经济与管理学院副院长,教授,南京工业大学应急治理与政策研究院研究员;本文系国家社科基金一般项目〈No.20BGL025〉“中国人工智能产业链韧性测度与提升机制研究”研究成果)
下一篇:低空看凉山邂逅别样泸沽湖