我国7个数据标注基地已建设数据集524个
创始人
2025-07-22 18:43:37
0

中国青年报客户端讯(中青报·中青网记者 贾骥业)记者7月22日从国家数据局了解到,截至今年上半年,我国7个数据标注基地已建设数据集524个,规模超过29PB(计算机存储容量单位,1PB等于1024TB——记者注),服务大模型也有163个。

数据,特别是高质量、多模态、精标注的数据,对人工智能发展至关重要。高质量数据集就是经过采集、加工等数据处理,可以直接用于开发和训练人工智能模型,能够有效地提升模型性能的高质量数据集合。

近年来,我国持续推进高质量数据集规范建设。国家数据局指导合肥、成都等7个城市建设了数据标注基地,先行先试探索数据标注产业发展经验。同时,国家数据局还指导全国数据标准化技术委员会秘书处发布了《高质量数据建设指南》《高质量数据集格式要求》《高质量数据集分类指南》等一系列技术文件和标准草案,并且组织开展试点验证。

国家数据局副局长余英介绍,下一步,国家数据局将充分发挥有效市场和有为政府的作用,以制度创新释放数据要素活力,以设施建设保障数据流通共享,着力打造“数据标注+高质量数据集+模型+应用场景+市场化价值化”的闭环生态,推进数据要素市场化配置改革和“人工智能+”行动同向发力、同频共振。

来源:中国青年报客户端

相关内容

热门资讯

约束,AI创造力的真正源泉   炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! (来源:虎嗅APP)...
校园配餐国标 为学生用餐安全护... (来源:劳动午报)转自:劳动午报 王桂霞:市场监管总局近日批准发布《校园配餐服务企业管理指南》国家标...
安徽省蚌埠市最新或2023(历...  现在,我代表市人民政府向大会报告工作,请予审议,并请市政协委员和其他列席人员提出意见。  一、攻坚...
最新或2023(历届)淮南市政...  各位代表:  现在,我代表市人民政府,向大会报告工作,请予审议,并请市政协委员和其他列席人员提出意...
芜湖市最新或2023(历届)两...   各位代表:  现在,我代表市人民政府,向大会报告工作,请予审议,并请市政协委员和其他列席人员提出...