国内首张大模型高阶通用能力测试证书颁发_热点

国内首张大模型高阶通用能力测试证书颁发

创始人

2026-01-06 18:35:04

中国消费者报海口讯（记者董芳忠）近日，在海南省海口市举办的全国信标委人工智能分委会“标准周”活动期间，国内首张大模型高阶通用能力国家标准符合性测试证书正式颁发，标志着我国大模型高阶通用能力评测实现标准化落地，为大模型产业规范化发展树立了关键里程碑。

为破解大模型高阶能力评测缺乏统一标准的行业痛点，中国电子技术标准化研究院于2025年9月启动“求索”大模型高阶通用能力测试工作。其中，大模型高阶通用能力聚焦复杂逻辑处理、代码应用实践、多模态交互等产业核心需求场景，构建了涵盖深度推理与复杂问题求解（含数学推理、图表推理）、代码理解与生成（含意图优化、多语言代码生成）、多模态理解与生成（含行为识别、视频问答、文本生成视频等）的全维度评测框架。测试全过程严格遵循国家标准GB/T 45288.2-2025《人工智能第2部分：评测指标与方法》，通过科学量化的指标体系，确保评测结果的权威性、公正性与可比性，为行业提供了清晰的技术发展导向。

中国电信自主研发的星辰语义大模型依托国产算力与训练框架研制，是国内唯一全国产、全尺寸、全开源的基础大模型。模型训练攻克国产万卡集群长稳训练技术难题，国产万卡集群利用率高达98%，训练效能较英伟达同等算力达93%。模型综合能力达到业界较高水平，当前已成功研发的多款核心基础模型中，2025年上半年的TeleChat2.5系列35B、115B模型综合能力表现优异，2025年12月TeleChat3-105B正式开源，为国内首个全国产化训练的千亿参数细粒度 MoE模型，同步开源稠密参数模型TeleChat3-36B，综合能力在MMLU-Pro、Math-500等多项权威评测基准中位列同等规模参数开源模型TOP3。模型竞争力获得行业广泛认可，开源社区累计下载量超50万次，斩获中国通信学会《2024年度十大科技进展》、2025世界人工智能大会卓越人工智能引领者奖（SAIL奖）等多项权威荣誉。

目前星辰系列语义大模型已实现规模化应用，全面支撑了各类toC、toH和产数类项目的交付。toC、toH方面，包括星小辰、AI眼镜、云智手机在内的多款产品中，上线了意图理解、AI代接、自由对话等多项自主研发能力，在实际业务中为用户带来了较好的交互体验。产数业务在电信集团内部的知识采编、通信助理、数字人客服等场景落地，覆盖全国31省，对外赋能中车、国能、航天等企业，真正推动芯片、模型、应用全链条自主可控，全面提升了我国在通用人工智能领域的自主创新能力。

上一篇：六九一二控股股东一致行动人蒋承龙质押232万股占总股本3.31%

下一篇：深城交拟更名"深城交科技集团" 凸显科技属性智慧交通业务占比超55%

国内首张大模型高阶通用能力测试证书颁发

相关内容

热门资讯