9家大模型再答高考作文，阅卷名师称AI写高考作文有提升_热点

创始人

2025-06-07 22:41:28

0次

来源：@第一财经日报微博

【#9家大模型再答高考作文#，#阅卷名师称AI写高考作文有提升#】一年一度高考来临，考生之后，按惯例是各家AI的答题时间。这一年AI模型圈加速迭代进化，让AI写作文，水平会有提高吗？让名师来打分，各大模型的成绩排名有多大变化？

“相较去年，AI进步很快，不再机械单一，变得有思想了。”在看完几家模型的作文后，四川南充市嘉陵一中语文教师李东林对第一财经表示。

2024年，第一财经写了一期九大模型“决战”高考，当时李东林老师在看完AI作文后，认为它们“缺一点情感和灵气”，到今年，他觉得AI已经补上了这方面，但仍达不到细腻。

“人写作，可以刻意抒情和感性，即使是思辨类题目，也需要去契合某些人的感受。”李东林认为，这是AI仍然缺少的部分。

湖南省中学语文特级教师左建国有同样的看法，他觉得Al作文整体有提升，但提升幅度不大。因为有关时代、社会与生活方面的新素材并不多，明显储存不够，尤其是在抒发个人情感方面，仍然是短板，缺少生命的温度。

左建国老师曾担任高考作文阅卷组的副组长，在高考阅卷方面有十几年的经验。“Al作文已经把考场作文变成一种可计算的拼图，形式上固然能逼近完美，但个性化的思考，以及拨动人心的语言，几乎没有看到，这是AI与真人思维的真正差别，也就难有高分与满分。”他认为。

具体到各家模型表现，去年是通义千问、元宝和豆包这三家大厂的AI排在前三，但今年，两个新入局的“选手”——谷歌的Gemini和DeepSeek空降榜单并列第一，元宝和通义千问排在第三和第四位，豆包降至第六位。

与去年同样，今年第一财经选取了国内外的九家模型，但厂商有所变化，新增了谷歌的Gemini和DeepSeek。这两个模型都在这一年里声量逐渐扩大，成为头部模型，在此次评分中，也是这两大模型作文成绩突出。

除了上述模型，第一财经也选取了海外的AI独角兽OpenAI，以及国内几个大厂玩家。去年的“AI六小虎”格局不再，从国内AI独角兽里选了月之暗面的Kimi和智谱。以上模型厂商都在业界有较高的知名度和受众，是基座厂商里有代表性的头部。

从此次作文表现看，智谱和ChatGPT表现较差排在末尾。几位老师在点评时多数提到了这两个模型的作文“论文味较重”，语言文字生硬，分析并不透彻，泛泛而谈。

不过，需要注意的是，各位老师对作文的喜好各有不同，分差部分也较大，以上打分仅供参考。李东林老师就对记者表示，评分不一定准确，他只是粗略打分，按照平时阅卷评分，误差在5分之间是正常范围。以豆包为例，有老师给了最高分，认为其内容不错，论述逻辑严密，但也有老师认为，豆包的结构不适合考场。

此外，第一财经此次测评用的是上海卷高考作文，这是一个较为思辨性的题目，论点论题较为明确，AI普遍答得都算不错。但今年高考全国一卷的作文，论题并不明显，考题用了诗歌引出，对AI就较有难度。

第一财经将AI写的全国一卷作文拿给老师看，他们反馈，这一题目AI写得有点乱，审题并不清楚。从表现上来看，AI适合写思辨类、逻辑分明的作文，任务越明确，表现越好。#高考作文#