转自:中国经营网
中经记者 石健 北京报道
在无锡,新日股份(603787.SH)电动车生产厂房、贝斯特(300580.SZ)涡轮增压生产线上,工人们在正常生产的同时,还有一项新的任务——穿戴智能采集终端,收集和回传数据。
近期,无锡数据集团有限公司(以下简称“无锡数据集团”)发布“千企百万小时”工业具身智能高质量数据采集行动计划——通过深入工业生产一线,为具身智能基座模型提供丰富、真实且具备高价值的“训练燃料”,打通具身智能研发走向工厂车间的“最后一公里”。
“这些数据回传采集后,将作为工业高质量数据集供给具身智能企业进行模型训练,破解工业多模态‘数据荒’难题。”作为上述计划的执行方,华智(无锡)人工智能科技有限公司(以下简称“华智AI”)副总经理李玮在接受《中国经营报》记者采访表示。
据透露,目前,华智AI已经与多家头部具身智能企业开展合作,辐射上海、杭州、苏州、南京等长三角核心城市,逐步跑通“上海提供研发模型与算法,无锡提供场景与数据落地”的跨区域协同模式。
数据采集打通工业化“最后一公里”
今年以来,随着具身智能产业走热,多个地方宣布推进具身智能数据采集计划。无锡则立足自身的制造业优势,发布首个工业级数据采集计划。
“具身智能在迈向工厂车间过程中,面临环境复杂、专业门槛极高等现实挑战,导致高质量多模态数据极度稀缺,严重制约了模型的泛化能力。为此,我们发起了工业级高质量数据采集计划。”谈及计划发布的背景,无锡数据集团相关负责人对记者说。
在该负责人看来,“真实场景、真实设备、真人操作”的原则,真实的社会化采集,摆脱了特定机器人的限制,通过便携式穿戴设备,直接把人类专家的操作经验“翻译”成数据,可以保证数据的“量”与“质”。
作为无锡数据集团的子公司,华智AI执行了上述采集计划。今年4月,华智AI牵头申报的“具身智能行业基于无本体数据采集的柔性生产高质量数据集建设项目”入选省工业和信息化领域行业高质量数据集建设先行先试联合体及项目名单。
李玮告诉记者,此次采集计划主要解决三方面问题。一是解决了“无数据可用”的现实难题。以前训练机器人用的多是互联网通用数据,缺乏工业一线的深度数据。通过大数据集,填补了工业高精度数据的空白,真正让大模型具备智能涌现的效果。并且在有训练数据支撑的情况下,能够做出超出预设、令人意想不到的智能动作。据记者了解,数据采集包括工业场景和非工业场景。“工业上,死磕焊接、组装等高精细、高柔性的核心工艺;非工业上,则瞄准居家、零售、旅游等公共服务,通过社会化大规模采集,逐步实现城市生活的全覆盖。”
二是建立了一套能用、好用的数据标准。“我们把复杂的现场操作变成标准化的工业多模态专家数据,立下了规矩。这能直接推动具身智能大模型走出实验室,在真实的工厂产线上真正跑通。”
据了解,数据经标准化采集、专业化处理后,将汇聚成全国首个工业级高质量具身智能数据集。这一数据集计划在2026年实现累计超万小时的有效数据突破。
三是让柔性制造真正落到实处。“打破传统设备只能干单一样式刚性任务的局限,让机器人具备了极强的适应能力和免编程迁移能力,换个新任务也能轻松上手。”
记者注意到,目前的数据采集方案已能将单位数据采集成本降至传统模式的三分之一,采集效率提升3倍。原因之一在于摆脱了对特定机器人的依赖。“传统模式换一台机器人就要重新编程和采集,硬件和人工投入极大。通过便携穿戴设备直接采集人类专家的操作经验,一次采集,全行业机器人通用,极大地省去了重复采集的成本。”李玮表示。
原因之二则是实现了数据处理的全自动化。通过引入自动化工具,把过去最耗费人力的多模态数据(视、听、力、触)清洗和标注工作交给算法搞定,实现了全自动批处理。
明确生态位 走出差异化
无锡作为长三角的制造业重镇,厚实的制造业家底,也为具身智能产业涌现无锡提供基础。
2025年4月,无锡市政府发布的《无锡具身智能机器人产业发展实施方案(2025—2027年)》提出,力争到2027年,产业规模突破300亿元,集聚企业200家,打造不少于300个典型应用场景。
据介绍,无锡数据集团及其子公司的战略落脚点已经全面锁定国家“十五五”规划,正全速推进工业级数据与算力基础设施建设。
华智AI成立于2025年6月,注册资本6000万元,由无锡数据集团全资控股,主要承载无锡人工智能创新中心的运营工作。
李玮介绍,华智AI定位“基础设施服务商”,聚焦在真实场景的后训练与垂域模型赋能,面向全行业大模型提供数据支撑。今年4月,华智AI牵头申报的“具身智能行业基于无本体数据采集的柔性生产高质量数据集建设项目”入选省工业和信息化领域行业高质量数据集建设先行先试联合体及项目名单。
据了解,依托已经成立的溪山基金及其他国资基金,无锡已在市场上精准遴选并投资了一批极具潜质的早期明星公司,包括穹彻智能、自变量、强脑(BrainCo)等行业黑马,通过资本纽带快速集聚产业生态。
在李玮看来,华智AI在整个具身智能生态中的功能定位就是建好基础设施、连接产业两端,担当“数据加工厂”与“场景路由器”。
“作为具身智能领域的‘国资队’,一端连接工业企业的真实生产现场,另一端赋能硬件本体厂商和大模型公司。面向上游的模型与本体厂商,扮演高质量数据与工具链‘稳定供应商’,按需去一线定向采集、精炼并交付数据;面向下游的制造企业,扮演柔性转型的‘技术赋能者’,将传统工厂零散的生产过程,转化为可用于 AI 训练的核心数据资产;面向行业整体,依托国资合规背景发挥‘信任枢纽’作用,牵头制定数据标准,打破各方的数据孤岛,真正让场景和数据安全流转起来,推动整个产业链的协同共赢。”李玮说。
“从目前的行业大趋势来看,专注具身模型研发和数据研发服务的两类公司,其核心价值正在被市场快速放大,但市面上优质的供应商仍然稀缺。因此,华智AI将全力发挥自身在场景和技术上的核心优势,卡位研发与服务商生态位。”李玮直言。
李玮透露,华智AI目前已与华为云、穹彻智能等行业头部具身智能企业展开深度合作。在地域上,我们以无锡为总部,深度辐射上海、杭州、苏州、南京等长三角核心城市。无锡数据集团、锡山经济技术开发区与国内头部具身智能企业穹彻智能签署战略合作协议,共同落地穹彻智能工业交付能力中心项目,逐步跑通了“上海研发模型与算法,无锡提供场景与数据落地”的跨区域协同模式。
采访中,李玮提到,在长三角区域,华智AI的核心差异化优势在于三点:一是产业场景, 无锡及苏南地区拥有庞大的新能源汽车供应链、物联网及高端制造业集群,能提供最真实、海量的工厂一线场景。二是“无本体”的技术壁垒。华智AI主导的技术让数据不绑定在任何特定机器人上。这种全行业通用的数据能力,是区别于传统硬件厂商的绝对优势。三是国资背景的合规与信任。作为无锡数据集团子公司,华智AI能更好地牵头省级先行先试项目,凝聚行业生态。
面对具身智能蓝海,华智AI如何扩大“朋友圈”?李玮表示,未来要从三方面着手:一是政企联动,配合工信、数据等部门,通过联合体项目和专项数据采集行动,凝聚行业生态伙伴;二是产学研共建,联动顶尖高校如南京航空航天大学、上海交通大学等联合申报课题,加速前沿学术成果在工业现场的工程化落地;三是开放赋能,向机器人本体厂商和集成商开放标准化数据集接口,助力其产品升级,以此拓展更多下游工业场景。