大模型国际标准
创始人
2025-04-15 06:46:05

  国际电信联盟电信标准分局(ITUT)于2025年3月正式发布ITU-T F.748.44基础模型的评估标准:基准测试/Assessment criteria for foundation models: Benchmark。该项国际标准由中国信通院牵头制定,规范了大模型基准测试的指标要求和测试方法。该标准旨在推动大模型基准测试体系架构形成国际共识,为大模型技术提供方和应用方提供高质量的能力评估依据,引导大模型技术及产业健康有序发展。

  本次发布的国际标准基于当前产学研界500余项基准测试系统性研究,一方面确立了大模型基准测试的4项核心要素,包括测试维度(测试场景、测试能力、测试任务和测试指标)、测试数据集、测试方法和测试工具。另一方面,针对通用场景的基础模型,提供了标准化的测试用例和范例流程,以支持企业规范开展大模型能力评估。

相关内容

热门资讯

6栋!396套房源!晋安一项目... 全面封顶!晋安三远片区重点项目榕发·云玺公馆传来好消息。近日,位于晋安区三远片区的重点项目榕发·云玺...
反诈宣传走进五凤街道 15日,“反诈护航·乐享银龄”暨国家安全教育日社区巡回活动在五凤山1号广场举办,老干部、退役军人、军...
无人机“买了就能飞”?“无证飞...   近期,福州市公安局上街(高新区)分局聚焦无人机违规飞行等隐患,持续加大查处力度,依法从严查办多起...
房东无故扣租户押金,怎么办?法...   租户租期届满退房,房东以墙体油漆脱落、下水道堵塞等理由拒不退还押金,应该如何处理?近日,福州市仓...
建总地产:与城市共生长 为民生... 4月的福州,被一层温润的绿意轻轻包裹。在建总·乌山梧桐序,全省首个总面积约2600平方米的峡谷立体生...