2026年2月3日,上海市第十六届人民代表大会第四次会议在上海世博中心开幕。市长龚正作政府工作报告。
在2026年《上海市政府工作报告》基础上,澎湃新闻美数课工作室借助大模型、智能体的多模态分析能力,使用文本向量化的数据分析方法,深度解析报告中的政策密码。
在今年经济社会发展成绩和未来展望中,“建设”“推进”和“发展”是出现频率最高的三大关键词。
澎湃新闻通过文本向量化分析发现,与“建设”关联度较高的词汇包括“加快”“产业”“创新”等,与“推进”关联度较高的词汇包括“科技”“城市”“服务”等,与“发展”关联度较高的词汇包括“深化”“经济”“格局”等。
在此基础上,澎湃新闻使用多款大模型和智能体,结合高频关联词网络和政府工作报告进行分析:MiniMax智能体的分析显示,上海以“建设、推进、发展”为核心,通过创新驱动、服务升级实现了经济、产业、城市能级的全面跃升;阶跃AI的分析显示,上海未来将聚焦“经济”“科技”深度融合,以“国际中心”势能强化“产业”竞争力,借“管理”“供给”革新推动“服务”精细化,在“融合”“持续”中锚定全球卓越城市新坐标。
在2026年《上海市政府工作报告》中,还出现了过去10年未曾提及的词语,例如“文旅商体展”“数据要素x”“微短剧”“具身智能”等。
“文旅商体展”方面,报告指出,过去一年上海开展 “票根” 联动促消费试点,文旅商体展融合效应持续放大。“数据要素x”“具身智能”体现了上海在科技领域的积极布局,上海已深入实施 “模塑申城” 工程,完善高端医疗器械、智能终端、智算云、具身智能、商业航天等产业发展政策。“微短剧”体现上海积极发展文化事业和文化产业,上海将持续提升影视创制、演艺、创意设计、超高清等文化产业能级,培育壮大微短剧、元宇宙等新型文化业态。
这些新词,体现出上海在全力促进经济平稳健康发展,着力推进科技创新和产业创新深度融合,改善营商环境等方面的重要举措。
结合上海市人民政府官网发布的2017年-2026年《上海市政府工作报告》,澎湃新闻进一步回顾了过去10年《政府工作报告》的关键词。过去10年间,“建设”“推进”以及“发展”等词汇,一直高频出现,是《上海市政府工作报告》中的“常青词汇”。
还有部分词汇在过去十年更频繁地出现在《上海市政府工作报告》中,比如“落地”“优化”“消费”“高质量”。这些词在逐年对比后呈现出明显的增长趋势,澎湃新闻将此类词语称为“喇叭形词语”。
分析方法:
1、本文所有原始文本材料来自上海市人民政府官网2017年至2026年政府工作报告。
2、基于MiniMax、派生万物等AI平台的文本向量化技术,对2026年上海市政府工作报告的高频词进行关联分析,通过提取共现向量和语义相似度向量,量化计算高频词间的关联关系。
3、本文使用jieba分词(https://github.com/fxsjy/jieba/)。采用精确分词模式,避免重复分词和歧义。分词结果均去掉数字、单字、标点符号。
4、为增加分词正确率,在jieba分词的基础上加入自定义词典,自定义词典主要包含了往年人民网和新华网统计的两会热词。
5、在分词基础上,采用TF-IDF加权技术。词语的重要性随着它在文本中出现的次数呈正比增加,但同时会随着它在语料库中出现的频率呈反比下降。
澎湃新闻记者 孔家兴 王亚赛