转自:军事科学院
随着大数据技术的迭代发展和智能化战争形态的加速演进,大数据已悄然来到3.0时代。当今世界发生的几场战争和冲突更加深刻地表明,大数据已经“无处不在、无时不有、无人不用”。显然,数智赋能已成为军事变革的“关键变量”之一。
聚焦人工智能时代大数据资源构建与共享、人工智能系统安全治理、可信数据空间建设、智能算力网络关键技术研究、数智领域应用新形态等前沿问题,由军事科学院主办,国防科技大学、浙江大学、北京理工大学、山东大学、西交网络空间安全研究院协办的第六届军事大数据论坛,于5月15至16日在杭州举行。
记者就军事大数据推动新质战斗力建设与发展相关话题,采访了军事科学院军事科学信息研究中心、北京理工大学计算机学院、哈尔滨工业大学计算机学院、电子科技大学计算机科学与工程学院的曹云波、毛先岭、王宏志、夏琦、谭玉珊等几位专家。
记者:在智能化战争中,大数据与大模型如何深度融合以支撑指挥决策、装备升级及新型作战样式?有哪些关键技术瓶颈需要突破?
曹云波:从指挥决策层面来看,大数据为指挥决策提供了海量的、多源异构的信息基础,大模型则具备强大的数据处理、分析和推理能力。在作战过程中,大模型可以融合历史数据,综合分析实时情报和环境数据等信息,快速评估战场态势变化,为指挥员及时提供决策建议,从而提高指挥决策的效率和准确性。对于装备建设而言,大数据与大模型的结合可以显著增强武器系统的智能化水平。比如,通过数据记录装备在多种环境下的实际运行状况、性能参数等信息,能够通过模型辅助分析来优化其在复杂战场环境中的性能表现。此外,还可以通过具身智能等方式将装备接入智能作战平台,提高其自主作战能力。
记者:数据成为驱动人工智能发展的核心要素,在国家安全与国防建设领域,应优先构建哪些基础能力?
毛先岭:从长时间尺度来看,数据是人工智能发展的主要驱动力量,算力和模型,都只是辅助力量。正如先有石油,才有发动机的发明,进而是工业革命的发生。发动机只是从石油中获取能力的工具。对于人工智能的发展,同样,先有数据,后有模型和算力,发展模型和算力的目的,只是为了更好地从数据中获得能力。因此,如何快速收集、整合文本、图像、传感器信息等不同类型的数据,并让这些数据与体现模型和算力的业务系统良好适配,是人工智能发展的核心。
对国防安全而言,未来战场必然要求实时融合卫星图像、通信情报、气象数据、战场态势数据等,并高效作出决策。这迫切要求建立三个方面核心能力:数据整合网——打破数据壁垒,像拼乐高一样快速组合各类数据;智能处理链——开发实时分析决策平台,让AI自己筛选关键信息,高效辅助决策;安全防护盾——在数据流动的每个环节加密,防止被敌方窃取或篡改。只有把这些基础能力像修路架桥一样先建好,才能让AI在国防领域真正跑起来、用得好。
记者:军事领域构建高可信智能数据资源体系时,如何解决多源异构数据的“碎片化”与“欺骗性”问题?需突破哪些关键技术以保障数据质量可信与算法决策可靠?
王宏志:军事数据在应用中受数据碎片化和真实性问题困扰,可以采取“双轮驱动”的方法解决这个问题。
第一个“轮子”是构建统一的数据标准和顶层架构。给每类数据集建立规则,让大家按照统一规则整理接入数据,数据管理就能井井有条。就像士兵们使用同一种语言交流,数据入库和接入会变得规范有序。第二个“轮子”是研发基于人工智能的新型数据整合技术。军事数据来源多样、真假混杂。利用人工智能这个“超级大脑”,发现数据关联、整合分散数据、让不同系统的数据和谐共处,才能为军事决策提供有效的服务。
军事数据面临真实性的挑战,需要建立多维度信息鉴真体系,以确保数据可信性。为提高军事数据质量和算法决策可靠性,应设计数据质量评估模型,打造安全高效的“供应链”;开发数据清洗系统,让数据更干净准确;提出“决策容错”算法架构,提高系统对劣质数据的承受力等。这些方法能让军事决策系统更稳健。
记者:在军事数据共享中,如何构建“可信数据生态”以破解数据“不敢共享、不能共享”的局面?
夏琦:在军事领域,大家在共享数据的时候,常常会碰到3个问题。一是“不能”。数据拥有方和使用方没办法实时了解对方的情况,数据无法充分共享。二是“不信”。数据共享的各方互不信任,无法得知数据的最终用途,没有采取足够的保护措施。三是“不愿”。目前在缺乏健全的评价反馈机制的前提下,相关方失去主动共享数据的积极性。
为解决好上述这“三不”问题,需要构建一个军事数据可信共享架构。首先,建设数据网格去中心化机制。搭建一条数据高速公路,把实时数据目录和调用机制连接到网络上。通过这条高速公路,数据拥有方和使用方就能直接“见面”交流,解决数据“不能”共享的问题。第二,利用基于智能合约的数据安全沙箱来检查数据的进出。这好比给数据装了一个“安检门”,只有经过检查,确保安全的数据才能进出。这样一来,数据是可用的,但又只能在“安检区”内严格按规定使用,无法滥用、无法带出,不用担心数据泄露,从而解决数据“不敢”共享的问题。第三,利用多层区块链网给用户建立一个独一无二的数字身份。这就像每人都有一个专属的身份证,赋予个体数据共享使用权益,记录相关方数据共享情况。在数据共享过程中,系统不仅会自动检查,还能全程追溯,就像给数据共享过程安装一个全方位监控器,从而解决数据“不信”的问题。最后,基于区块链上的记录信息设立一个评价机制。通过该评价机制,那些愿意共享的用户会提供更优质数据资源,拥有更多共享机会,获得更高评价。这样一来,军事数据共享就可以形成一个良性循环,从而解决数据“不愿”的问题。
记者:面向未来军事智能化发展需求,如何构建高质量军事语料数据?
谭玉珊:构建高质量军事语料数据,就像为AI打造一本“军事百科全书”,需要抓住4个核心要点。一是内容要专。数据必须体现军事特色,比如作战术语、战术案例等。二是覆盖要广。既要涉及军事领域文本、图像数据,又要包括视频、语音等多类型信息。三是筛选要准。剔除无效或低质数据,精炼保留能反映日常战备和军事行动的真实、高价值数据。四是规模要大。数据量需足够支撑AI模型,像人类大脑一样深度学习。
当前,对于世界各军事强国来说,军事语料建设都是一项庞大的工程,还有很多工作亟待推进:完善语料规范研究,通过统一认识、统一标准加速语料质量提升;创新数据空间的全军协调机制,调度不同“保险箱”的数据共同实现语料建设的规模化、多样化;突出智能技术赋能思想,联合军事理论专家、技术专家、数据专家对语料技术瓶颈开展联合攻关,显著提升机器对数据军事特征的智能理解和自动识别;平衡“安全”与“应用”,实现语料数据按需分发,从而最大程度发挥语料数据的军事运用价值。
来源:解放军报