人工智能在古典学研究中的应用
创始人
2025-06-23 05:47:08
0

转自:光明日报

  近年来,人工智能正悄然丰富着古典学的研究方式,为古典文本的校勘、翻译与注释,古典文学的解读,碑铭和纸草等古代文物研究带来革命性突破。人工智能的快速发展,解决了传统研究方法在工作效率上的问题。不过,这一新兴技术的应用与“慢工出细活”的传统认识有所背离,还可能削减研究者享受的趣味。当热爱古典学的计算机爱好者在利物浦古典学群邮中宣称,希望有学者愿意一同用人工的翻译来训练人工智能翻译古典文本时,有学者表示强烈反对,指责人工智能翻译的作品质量低劣,甚至损害了古典文本的美感;也有学者声称这威胁到古典学家的饭碗;还有人认为即使训练人工智能,人的翻译也是不可替代的创造性工作。当学生开始利用人工智能完成作业,这是否意味着传统的古典学教学模式面临一些挑战?以模式化的方式处理材料是否会令学者成为技术员工?人工智能到底会对古典学这门古老的学科产生怎样的影响?本文试图介绍人工智能在古代传世文献与出土文物方面的应用,揭示人机协作在古典学研究的前景。

古典文本分析与数字化

  古典学巨擘维拉莫维茨曾在1872年用“未来语文学”嘲讽尼采的《悲剧的诞生》,如今普林斯顿大学芭芭拉·格雷西斯团队将其挪用于表达人工智能在语文学的前景,即机器学习在处理抄本、印刷版和电子版的文本时能为语文学提供新的方法和视角。该团队探讨了人工智能如何辅助古希腊文本的校勘,并指出这种跨学科合作的潜在益处和挑战。通过设计算法,人工智能可以自动检测并纠正抄工的错误,并提出文本残缺处可能的校勘选择。然而,在涉及文本的真实性和可靠性时,这种方法也面临挑战。对于填补缺失文本,人工智能可以通过模拟缺失部分来评估算法的准确性。但对于纠正抄写方面的错误,评估难度则更大。普林斯顿团队提出了一种基于概率的算法,通过权衡文本的可能性和机器的置信度来检测和纠正错误。

  人工智能不仅能辅助古典文本的校勘,还可以用于研究作者问题并进行文学阐释。由于人工智能进行词频统计、语义分析和文本结构解析的速度更快,更全面和高效的文本分析为荷马史诗的作者问题提供了一份参考答案——《伊利亚特》和《奥德赛》由多位作者共同创作。悲剧《雷索斯》曾经被学者归为欧里庇得斯之作,而人工智能通过量化分析多部剧作揭示出该剧的文风受到埃斯库罗斯和欧里庇得斯的显著影响,但作者可能是一位公元前4世纪的演员。文学阐释方面,人工智能可以识别文学隐喻与修辞模式、分析古典文献的情感表达,从而为古代情感研究奠定技术基础。不过,人工智能在还原文本语境和文意阐释方面还存在不少问题。基于此,人机协作可以兼顾重构文本的准确性和美感。

  此外,人工智能还有助于将古典文献数字化并改变文献检索的方式。古典文献的特殊字体和抄本的年代久远,传统光学字符识别技术的准确率有限。近年来,谷歌开发的新光学字符识别和神经网络算法有助于识别复杂字体,从而助力古典文献的数字化。在古典文献检索方面,日本学界正致力于建设专业的西方古典学人工智能对话机器“古代文本”。目前其文本库存有限,对于较为冷门的古典作家则仍需采用传统的检索方式,暂时无法取代专业数据库资源。

出土文物的识读、重构与鉴别

  公元79年因维苏威火山爆发而被掩埋、因高温碳化而变得异常脆弱的纸草文献是研究古希腊罗马历史的重要资料。学者曾利用X射线断层扫描技术对其进行3D扫描,在3D图像中精准追踪并铺平卷曲的纸草层。尽管技术不断进步,赫库兰尼姆纸草文献的修复依然面临诸多挑战,其中最显著的便是纸草碎片的数量庞大、结构复杂。由于其卷曲碳化后,层与层之间高度粘连,造成重叠层以及编号混乱。早期的剥离操作可能已经破坏纸草原有的物理结构,而19世纪的不少摹本存在伪造之嫌疑,利用碳化纸草及其摹本研究仍然困难重重。

  为此,布里斯托大学的托马斯·考沃德利用开源三维网格处理软件对三维卷轴模型进行精密分析,可在虚拟环境中模拟纸草的曲面结构,以地球仪般自由旋转观察纸草纤维的痕迹与层次变化。相比常见的电子显微镜和人工肉眼观察,该工具不仅可以放大对比碳化层的颜色变化,也可测量缝隙、推测卷绕方向,由此推测笔画走向从而重建文本。借助摄影测量与3D打印等技术,一些卷轴模型已经以实体形式复现,为研究者提供了独特的观察体验,也为校勘纸草带来了新进展。例如,在赫库兰尼姆纸草第243篇第2段中,19世纪抄写者曾将其中一行残缺文本补足为著名的希腊化作者“卡利马科斯”,而考沃德提出新的解释,认为应是涉及赫尔墨斯与阿卡卡利斯的故事,并将首行残留字母改读为“卡利多斯”,即残缺的“阿卡卡利斯”的属格形式。与此同时,卷轴排版的研究也得到新的解释,作品标题与卷次有时候会并排排列,这种排版方式可能与该纸草在卷轴中的具体位置和功能有关。考沃德致力于在未来推广这项新技术,以方便纸草学家远程获取资料,也为未来实现自动化识别与虚拟修复纸草奠定坚实基础。

  蒙森等学者主张“亲眼看”碑铭实物的原则也曾被纸草学家吸收,这一原则在当今数字化时代可能不再是金科玉律,对碳化纸草尤其如此。过去学者们千里迢迢赶往梵蒂冈图书馆、巴黎国家图书馆等现场去亲眼看纸草或抄本实物,如今纸草重叠结构、残碎的纤维、墨迹等肉眼无法看清的细节,在3D成像上实际更加清晰。除碳化纸草之外,对于保存情况相对较好的纸草,佛罗伦萨团队通过人工神经网络来重新排列纸草残篇,转录项目正尝试训练人工智能基于字母宽度和笔画匹配度提取纸草上的字母实现“机器看”,由机器直接识别字母。

  对于碑铭和钱币而言,“亲眼看”和“机器看”的结合也同样有益。生成式人工智能在碑铭翻译方面为研究带来便捷,提升了初学者浏览和整理史料的速度,而伊萨卡项目不仅能够复原残缺的铭文,还能为碑铭的铭刻时间与地理位置提供参考。不过需要注意的是,目前铭文数据库的开源程度较低,可参考的平行文本数量较少且年代久远。在钱币鉴定方面,人工智能利用计算机视觉技术分析钱币图像,识别其正反面肖像、铸币厂标记等符号,并与数据库进行比对,进而推断铸币者和铸造年份等历史背景信息。人工智能可以根据钱币图像,评估其磨损程度、光泽、划痕等,由此客观分级并初步估算市场价值。相较于人眼主观性较强的分级过程,未来得到充分训练的人工智能可能会提供更客观的评估模式。然而,人工智能的识别依赖于高质量的图像,光线不足的照片或分辨率低的图像会影响识别的准确性。识别能力还取决于其数据库的广度,罕见或独特的硬币有时难以被准确识别。

  在钱币学研究中,“机器看”的效率远远超出“肉眼看”,用人工智能辅助模具研究值得期待。模具研究需要收集同一样式的所有钱币样本,判断相似的钱币是否使用了同一模具,估算出铸造这些钱币使用的模具数量,并根据模具损耗程度和模具关联性进一步推断出钱币的产量,用于研究货币需求和钱币的白银量等经济情况。在模具研究的实操过程中,肉眼比较相似钱币很容易出错,皇帝鼻梁的曲度和头发等细节时常令学者眼花缭乱。钱币学家不仅要核对《罗马行省钱币》和《罗马帝国钱币》等公开出版的钱币学目录,还需要查询拍卖行的数据库中更为丰富的样本。当学者面临同一样式的几十枚甚至成百上千的样本,肉眼比对变得十分困难,训练人工智能来实现模具研究十分必要。由于自动化程度有限以及需要进行3D扫描,过去美国钱币学会使用的半自动计算机辅助模具研究(CADS)方法仍有待改进。法国国家研究署最新的实验致力于实现自动化的模具研究,将目标定为识别潜在的共同模具而非图像匹配。人工智能处理数千枚钱币的铸币模具研究只需几个小时即可完成,而钱币学家则需要数周时间。

  综上,不论是传世文献还是出土文物,人工智能并未取代学者在古典学研究中的作用。“亲眼看”文物的时代并未落幕,“机器看”材料的时代已然到来,二者的结合在识读碳化或纤维层交错的纸草、钱币模具研究等领域成效显著。然而,在欧美国家削减文科经费的大环境下,技术的推广需要时间,恐怕也并非易事。人工智能究竟是一时热浪,还是会逐渐嵌入古典学的研究方法,让我们拭目以待。

(作者:白珊珊,系四川大学古典学系助理研究员)

相关内容

热门资讯

6月20日科创医药ETF嘉实(... 6月20日,科创医药ETF嘉实(588700)涨0.20%,成交额2573.75万元。当日份额减少5...
6月20日中证A50ETF易方... 6月20日,中证A50ETF易方达(563080)涨0.27%,成交额6526.80万元。当日份额减...
6月20日能源ETF(5612... 6月20日,能源ETF(561260)跌0.37%,成交额425.66万元。当日份额减少40.00万...
6月20日800自由现金流ET... 6月20日,800自由现金流ETF(563680)涨0.60%,成交额461.40万元。当日份额减少...
6月20日科创成长ETF南方(... 6月20日,科创成长ETF南方(589700)跌0.50%,成交额584.27万元。当日份额减少20...