来源:@第一财经日报微博
【#9家大模型再答高考作文#,#阅卷名师称AI写高考作文有提升#】一年一度高考来临,考生之后,按惯例是各家AI的答题时间。这一年AI模型圈加速迭代进化,让AI写作文,水平会有提高吗?让名师来打分,各大模型的成绩排名有多大变化?
“相较去年,AI进步很快,不再机械单一,变得有思想了。”在看完几家模型的作文后,四川南充市嘉陵一中语文教师李东林对第一财经表示。
2024年,第一财经写了一期九大模型“决战”高考,当时李东林老师在看完AI作文后,认为它们“缺一点情感和灵气”,到今年,他觉得AI已经补上了这方面,但仍达不到细腻。
“人写作,可以刻意抒情和感性,即使是思辨类题目,也需要去契合某些人的感受。”李东林认为,这是AI仍然缺少的部分。
湖南省中学语文特级教师左建国有同样的看法,他觉得Al作文整体有提升,但提升幅度不大。因为有关时代、社会与生活方面的新素材并不多,明显储存不够,尤其是在抒发个人情感方面,仍然是短板,缺少生命的温度。
左建国老师曾担任高考作文阅卷组的副组长,在高考阅卷方面有十几年的经验。“Al作文已经把考场作文变成一种可计算的拼图,形式上固然能逼近完美,但个性化的思考,以及拨动人心的语言,几乎没有看到,这是AI与真人思维的真正差别,也就难有高分与满分。”他认为。
具体到各家模型表现,去年是通义千问、元宝和豆包这三家大厂的AI排在前三,但今年,两个新入局的“选手”——谷歌的Gemini和DeepSeek空降榜单并列第一,元宝和通义千问排在第三和第四位,豆包降至第六位。
与去年同样,今年第一财经选取了国内外的九家模型,但厂商有所变化,新增了谷歌的Gemini和DeepSeek。这两个模型都在这一年里声量逐渐扩大,成为头部模型,在此次评分中,也是这两大模型作文成绩突出。
除了上述模型,第一财经也选取了海外的AI独角兽OpenAI,以及国内几个大厂玩家。去年的“AI六小虎”格局不再,从国内AI独角兽里选了月之暗面的Kimi和智谱。以上模型厂商都在业界有较高的知名度和受众,是基座厂商里有代表性的头部。
从此次作文表现看,智谱和ChatGPT表现较差排在末尾。几位老师在点评时多数提到了这两个模型的作文“论文味较重”,语言文字生硬,分析并不透彻,泛泛而谈。
不过,需要注意的是,各位老师对作文的喜好各有不同,分差部分也较大,以上打分仅供参考。李东林老师就对记者表示,评分不一定准确,他只是粗略打分,按照平时阅卷评分,误差在5分之间是正常范围。以豆包为例,有老师给了最高分,认为其内容不错,论述逻辑严密,但也有老师认为,豆包的结构不适合考场。
此外,第一财经此次测评用的是上海卷高考作文,这是一个较为思辨性的题目,论点论题较为明确,AI普遍答得都算不错。但今年高考全国一卷的作文,论题并不明显,考题用了诗歌引出,对AI就较有难度。
第一财经将AI写的全国一卷作文拿给老师看,他们反馈,这一题目AI写得有点乱,审题并不清楚。从表现上来看,AI适合写思辨类、逻辑分明的作文,任务越明确,表现越好。#高考作文#
上一篇:全球高考图鉴韩国高考一天考完6门
下一篇:@党员干部,这些饭局去不得!