中国消费者报海口讯(记者董芳忠)近日,在海南省海口市举办的全国信标委人工智能分委会“标准周”活动期间,国内首张大模型高阶通用能力国家标准符合性测试证书正式颁发,标志着我国大模型高阶通用能力评测实现标准化落地,为大模型产业规范化发展树立了关键里程碑。
为破解大模型高阶能力评测缺乏统一标准的行业痛点,中国电子技术标准化研究院于2025年9月启动“求索”大模型高阶通用能力测试工作。其中,大模型高阶通用能力聚焦复杂逻辑处理、代码应用实践、多模态交互等产业核心需求场景,构建了涵盖深度推理与复杂问题求解(含数学推理、图表推理)、代码理解与生成(含意图优化、多语言代码生成)、多模态理解与生成(含行为识别、视频问答、文本生成视频等)的全维度评测框架。测试全过程严格遵循国家标准GB/T 45288.2-2025《人工智能 第2部分:评测指标与方法》,通过科学量化的指标体系,确保评测结果的权威性、公正性与可比性,为行业提供了清晰的技术发展导向。
中国电信自主研发的星辰语义大模型依托国产算力与训练框架研制,是国内唯一全国产、全尺寸、全开源的基础大模型。模型训练攻克国产万卡集群长稳训练技术难题,国产万卡集群利用率高达98%,训练效能较英伟达同等算力达93%。模型综合能力达到业界较高水平,当前已成功研发的多款核心基础模型中,2025年上半年的TeleChat2.5系列35B、115B模型综合能力表现优异,2025年12月TeleChat3-105B正式开源,为国内首个全国产化训练的千亿参数细粒度 MoE模型,同步开源稠密参数模型TeleChat3-36B,综合能力在MMLU-Pro、Math-500等多项权威评测基准中位列同等规模参数开源模型TOP3。模型竞争力获得行业广泛认可,开源社区累计下载量超50万次,斩获中国通信学会《2024年度十大科技进展》、2025世界人工智能大会卓越人工智能引领者奖(SAIL奖)等多项权威荣誉。
目前星辰系列语义大模型已实现规模化应用,全面支撑了各类toC、toH和产数类项目的交付。toC、toH方面,包括星小辰、AI眼镜、云智手机在内的多款产品中,上线了意图理解、AI代接、自由对话等多项自主研发能力,在实际业务中为用户带来了较好的交互体验。产数业务在电信集团内部的知识采编、通信助理、数字人客服等场景落地,覆盖全国31省,对外赋能中车、国能、航天等企业,真正推动芯片、模型、应用全链条自主可控,全面提升了我国在通用人工智能领域的自主创新能力。