2026-06-27 15:13
AI(人工智能)大模型是当今时代具有里程碑意义的突破性成就,它对人类社会的影响将是全方位的。史学作为一门研究以往人类社会的学问,想要置身于其影响之外,既不应该,又不可能。史无定法,全面吸纳,将其引为新的研究方法,自是题中应有之义。此所谓“预流”。问题在于,我们应该怎样更好地来预这个“流”呢?
数字技术影响史学的三个波次
大体讲,近三四十年来,数字技术对史学影响比较集聚的有三个波次。第一波次是在20世纪90年代初期的“换笔”,即从在纸张上执笔书写,换成敲击键盘将文字“写”到电脑屏幕上。文史学者群体“换笔”的过程持续颇久,这与当时的计算机技术、与改革开放之初社会经济两方面的发展水平都有关系。不过大多数学者对新技术是开怀拥抱、积极投入的。“换笔”使我们摆脱手工操作,开始走向机器时代,迈出了划时代的一步。
第二波次是大约从20世纪90年代末开始持续推进的全文数据库的应用,具有代表性的事件包括《四库全书》全文检索数据库、《中国基本古籍库》以及中国知网数据库的推出。全文数据库的大规模应用,极大方便了学者搜集历史资料的工作。后来,人们在全文数据库应用的基础之上,提出了所谓的数字人文的概念——通过综合分析与运用数据,来帮助史学研究工作,具体包括文本挖掘、数据可视化等方面内容。
第三波次是近几年兴起的人工智能大模型。如果说前两个波次的影响比较明确地局限于技术层面,不可能“侵犯”到史学家的主体性,那么第三波次的AI大模型看来就有些不一样,它似乎已有了某种自主的思维能力,“准备来抢史学家的饭碗”。
AI大模型与历史认识之间的关系
AI大模型究竟能够在多大程度上帮助历史学家来“研究”历史?它与真正史学家之间的分界线可能在哪儿?根据目前有限的理解,有一点看来是相对明确的:AI大模型对语料库的阅读是平面化的,“大语言模型既无法体察研究对象背后的主观意图,更无法理解思想的历史渊源和发展脉络,也难以通过算法体现非理性因素”。它不可能“移情”于历史研究对象,使自己的阅读呈现某种人文性,更不可能形成历史意识。据此,本文再就两方面的情况稍作具体的解释。
其一是笔者以前在一篇小文中已经提出的困惑:“当文本未能在字面上直接反映历史信息时,我们该怎么办?”作为可见可感的表层结构,文本是外观的,也是有限的,在一系列词元串联而成的外观之下,从每一个词元到整个段落,都可能蕴含着多重的寓意,这就是文字背后的信息。AI大模型通过对相关文本的比较联系,估计能够释读出一些相对简单的背后信息。例如,宋代范仲淹表字希文,这两个字符串指的是同一个人,将包含这样不同词元的文本相互联系起来,作出归纳释读,大概不会有大问题,尽管这里仍然存在为什么一称姓名,另一称表字的差别需要考虑;不过如果另外有一个远不如范仲淹那么著名的历史人物,也以希文为字号,释读起来(即将两者联系起来)就更困难一些。有些隐匿于背后的底层信息与文本之间的关系,本来就需要史学家经过多方考证才能够大致揭示,估计AI就难以应对了。从个别概念的借用、比拟,到文本整体的反讽、转喻,再到作者语气重点之所在等等,需从个别语句、段落,联系到全篇,进而贯穿全书,以至理解作者于彼时彼境的心境、立场——即所谓“移情”,有的时候甚至可能距离文本的表层结构转了十七八个弯,这些都有赖于研究者对更为全面史实的深入了解与追索,超越存世文本数量与历史真实之间在概率方面不可避免的失衡,才有可能触及文本试图传递的真实信息。
其二,在史学领域,如果“技术性”地来分剖,通向最终解悟的路径也许就是对历史现象的不断观察,以及勾连与比较,发现其与既有认识的落差和创造新知识可能的入口。学术史与历史记载的交叉点,往往可以是一个新议题的起点,就是指通过勾连和比较既有历史知识与存世历史信息间的落差,或者说不吻合,发现可供进一步探究的空间,才有可能创造出新的历史知识。这样的勾连与比较,涉及的信息结构与层次常常相当复杂,大多并非现成的资料数据库所能包含,各种不同信息相互间的跨度,也可能大到AI大模型无法将它们联系起来作“思考”,这大概是只有人脑才可能完成的任务。
如果说读书能否“得间”,只是指发现一些具体的史实,倒还无关宏旨,AI大模型能否揭示出一些前人未曾发现的历史现象,提出关于人类历史社会演进的新见解,则更重要。史学研究与所有科学创新一样,举凡信息分析、资料解读和实验试错——在史学研究中大概就是反复推测与论证,都不过是基础性的铺垫而已,目的全在于达到某个节点上的灵感闪现,以得到对研究议题的最终解悟。那么,AI大模型的运作是否可能自主地灵感闪现呢?
如将史学研究分为不同“工序”,第一道工序应是史实复原,第二道工序则是现象阐释,即对研究对象进行分析,提出自己的认识。史学家基于已有认知,又因不同个体存在性情、认知偏好以及思想差异,会从真实世界获取不同的刺激和灵感,这也与研究者个体的天赋、眼界、生命体验密切相关,最终才是对历史认识的灵光一闪。在这一层面上,AI不太可能取代史学家。
总之,史学虽然强调积累,被称为“实学”,但是本质上与所有学术研究一样,真正重要的发现从来都离不开想象力所触发的灵光一闪。至少从目前的认知看,AI大模型对于这一关键点估计难以企及。更何况任何AI大模型的应用,都有赖于研究主体——史学家——来设定主题,其间立意之高下判若云泥,问题也就更复杂。
多面相影响之下的应对之道
首先,历史现象精彩纷呈,历史学家不可能将它们全都纳入关注,必须按某种思路,选择有限的侧面去作研究。有学者强调要关注那些“具有实质意义的、对研究全局具有‘牵动’作用的问题”。AI大模型在方便学者梳理文献、归纳史实的同时,可能有助于接近某些此前隐而不显的历史社会现象,不过议题的提出毕竟是相当主观的过程,当学者从此前在对历史社会整体理解的基础上,通过读书“得间”来设定观察路径,转向更多利用AI大模型来处理资料之时,难免会导致因为过于关注具体技术细节,而忽略对历史社会的整体把握,从而放大史学家作为现代人的主观性。
其次,在扎实的资料积累的基础之上,由灵感触动深化认识,本来就是史学研究获得真正学术创新的必由途径,可是现实的学术生态总是难以企及这种理想化的状况。既有知识重组的铺叙性专文与专书,正占据着史学出版物的多数,当从业者能够熟练地应用AI大模型后,这样的文字工作显然会更加方便,从而催生更大的“产量”。所以,如何将AI大模型在史学领域的应用引导到恰当的方向,不仅是学者群体本身,而且是学术管理部门必须认真对待的问题。
最后,熟读基础性历史文献是更好地利用全文检索数据库的前提,AI大模型的使用也不例外,“传统的”史学基本功必不可少。文献释读、文本写作、逻辑思考等各方面的训练,将永远是史学入门的基础课。目前,AI大模型正开始给执掌历史课的教师制造麻烦,但帮助学生了解AI大模型,掌握应用它的能力,也是教师应承担起来的新任务。这两个方面的关系如何平衡,是教师和教育管理部门不得不认真思考的问题。
AI大模型毕竟不过是一种新技术,而不是“类人”生物,它不可能剥夺史学家在研究工作中的主体性,甚至有可能反而会让这种主体性更加凸显。AI大模型完全有可能帮助史学家完成大量重复性与操作性的工作,极大提高研究工作的效率,让他们更少一些“匠气”,将宝贵的智力更多投入深刻的历史思维中。任何新技术的影响都是多面的与复杂的,不过这一切都不应该妨碍我们去积极地了解、掌握进而应用AI大模型。认识AI大模型的局限性,正是为了更好地应用它。面对新技术的影响,如何冷静周全地协调各方面的关系,以切实助推史学的进步,是学术管理部门必须完成的重要作业。
(作者为浙大城市学院历史研究中心主任)