AI不可能剥夺史学家在研究工作中的主体性

北京日报客户端 | 作者包伟民

2026-06-27 15:13

学习

AI（人工智能）大模型是当今时代具有里程碑意义的突破性成就，它对人类社会的影响将是全方位的。史学作为一门研究以往人类社会的学问，想要置身于其影响之外，既不应该，又不可能。史无定法，全面吸纳，将其引为新的研究方法，自是题中应有之义。此所谓“预流”。问题在于，我们应该怎样更好地来预这个“流”呢？

数字技术影响史学的三个波次

大体讲，近三四十年来，数字技术对史学影响比较集聚的有三个波次。第一波次是在20世纪90年代初期的“换笔”，即从在纸张上执笔书写，换成敲击键盘将文字“写”到电脑屏幕上。文史学者群体“换笔”的过程持续颇久，这与当时的计算机技术、与改革开放之初社会经济两方面的发展水平都有关系。不过大多数学者对新技术是开怀拥抱、积极投入的。“换笔”使我们摆脱手工操作，开始走向机器时代，迈出了划时代的一步。

第二波次是大约从20世纪90年代末开始持续推进的全文数据库的应用，具有代表性的事件包括《四库全书》全文检索数据库、《中国基本古籍库》以及中国知网数据库的推出。全文数据库的大规模应用，极大方便了学者搜集历史资料的工作。后来，人们在全文数据库应用的基础之上，提出了所谓的数字人文的概念——通过综合分析与运用数据，来帮助史学研究工作，具体包括文本挖掘、数据可视化等方面内容。

第三波次是近几年兴起的人工智能大模型。如果说前两个波次的影响比较明确地局限于技术层面，不可能“侵犯”到史学家的主体性，那么第三波次的AI大模型看来就有些不一样，它似乎已有了某种自主的思维能力，“准备来抢史学家的饭碗”。

AI大模型与历史认识之间的关系

AI大模型究竟能够在多大程度上帮助历史学家来“研究”历史？它与真正史学家之间的分界线可能在哪儿？根据目前有限的理解，有一点看来是相对明确的：AI大模型对语料库的阅读是平面化的，“大语言模型既无法体察研究对象背后的主观意图，更无法理解思想的历史渊源和发展脉络，也难以通过算法体现非理性因素”。它不可能“移情”于历史研究对象，使自己的阅读呈现某种人文性，更不可能形成历史意识。据此，本文再就两方面的情况稍作具体的解释。

其一是笔者以前在一篇小文中已经提出的困惑：“当文本未能在字面上直接反映历史信息时，我们该怎么办？”作为可见可感的表层结构，文本是外观的，也是有限的，在一系列词元串联而成的外观之下，从每一个词元到整个段落，都可能蕴含着多重的寓意，这就是文字背后的信息。AI大模型通过对相关文本的比较联系，估计能够释读出一些相对简单的背后信息。例如，宋代范仲淹表字希文，这两个字符串指的是同一个人，将包含这样不同词元的文本相互联系起来，作出归纳释读，大概不会有大问题，尽管这里仍然存在为什么一称姓名，另一称表字的差别需要考虑；不过如果另外有一个远不如范仲淹那么著名的历史人物，也以希文为字号，释读起来（即将两者联系起来）就更困难一些。有些隐匿于背后的底层信息与文本之间的关系，本来就需要史学家经过多方考证才能够大致揭示，估计AI就难以应对了。从个别概念的借用、比拟，到文本整体的反讽、转喻，再到作者语气重点之所在等等，需从个别语句、段落，联系到全篇，进而贯穿全书，以至理解作者于彼时彼境的心境、立场——即所谓“移情”，有的时候甚至可能距离文本的表层结构转了十七八个弯，这些都有赖于研究者对更为全面史实的深入了解与追索，超越存世文本数量与历史真实之间在概率方面不可避免的失衡，才有可能触及文本试图传递的真实信息。

其二，在史学领域，如果“技术性”地来分剖，通向最终解悟的路径也许就是对历史现象的不断观察，以及勾连与比较，发现其与既有认识的落差和创造新知识可能的入口。学术史与历史记载的交叉点，往往可以是一个新议题的起点，就是指通过勾连和比较既有历史知识与存世历史信息间的落差，或者说不吻合，发现可供进一步探究的空间，才有可能创造出新的历史知识。这样的勾连与比较，涉及的信息结构与层次常常相当复杂，大多并非现成的资料数据库所能包含，各种不同信息相互间的跨度，也可能大到AI大模型无法将它们联系起来作“思考”，这大概是只有人脑才可能完成的任务。

如果说读书能否“得间”，只是指发现一些具体的史实，倒还无关宏旨，AI大模型能否揭示出一些前人未曾发现的历史现象，提出关于人类历史社会演进的新见解，则更重要。史学研究与所有科学创新一样，举凡信息分析、资料解读和实验试错——在史学研究中大概就是反复推测与论证，都不过是基础性的铺垫而已，目的全在于达到某个节点上的灵感闪现，以得到对研究议题的最终解悟。那么，AI大模型的运作是否可能自主地灵感闪现呢？

如将史学研究分为不同“工序”，第一道工序应是史实复原，第二道工序则是现象阐释，即对研究对象进行分析，提出自己的认识。史学家基于已有认知，又因不同个体存在性情、认知偏好以及思想差异，会从真实世界获取不同的刺激和灵感，这也与研究者个体的天赋、眼界、生命体验密切相关，最终才是对历史认识的灵光一闪。在这一层面上，AI不太可能取代史学家。

总之，史学虽然强调积累，被称为“实学”，但是本质上与所有学术研究一样，真正重要的发现从来都离不开想象力所触发的灵光一闪。至少从目前的认知看，AI大模型对于这一关键点估计难以企及。更何况任何AI大模型的应用，都有赖于研究主体——史学家——来设定主题，其间立意之高下判若云泥，问题也就更复杂。

多面相影响之下的应对之道

首先，历史现象精彩纷呈，历史学家不可能将它们全都纳入关注，必须按某种思路，选择有限的侧面去作研究。有学者强调要关注那些“具有实质意义的、对研究全局具有‘牵动’作用的问题”。AI大模型在方便学者梳理文献、归纳史实的同时，可能有助于接近某些此前隐而不显的历史社会现象，不过议题的提出毕竟是相当主观的过程，当学者从此前在对历史社会整体理解的基础上，通过读书“得间”来设定观察路径，转向更多利用AI大模型来处理资料之时，难免会导致因为过于关注具体技术细节，而忽略对历史社会的整体把握，从而放大史学家作为现代人的主观性。

其次，在扎实的资料积累的基础之上，由灵感触动深化认识，本来就是史学研究获得真正学术创新的必由途径，可是现实的学术生态总是难以企及这种理想化的状况。既有知识重组的铺叙性专文与专书，正占据着史学出版物的多数，当从业者能够熟练地应用AI大模型后，这样的文字工作显然会更加方便，从而催生更大的“产量”。所以，如何将AI大模型在史学领域的应用引导到恰当的方向，不仅是学者群体本身，而且是学术管理部门必须认真对待的问题。

最后，熟读基础性历史文献是更好地利用全文检索数据库的前提，AI大模型的使用也不例外，“传统的”史学基本功必不可少。文献释读、文本写作、逻辑思考等各方面的训练，将永远是史学入门的基础课。目前，AI大模型正开始给执掌历史课的教师制造麻烦，但帮助学生了解AI大模型，掌握应用它的能力，也是教师应承担起来的新任务。这两个方面的关系如何平衡，是教师和教育管理部门不得不认真思考的问题。

AI大模型毕竟不过是一种新技术，而不是“类人”生物，它不可能剥夺史学家在研究工作中的主体性，甚至有可能反而会让这种主体性更加凸显。AI大模型完全有可能帮助史学家完成大量重复性与操作性的工作，极大提高研究工作的效率，让他们更少一些“匠气”，将宝贵的智力更多投入深刻的历史思维中。任何新技术的影响都是多面的与复杂的，不过这一切都不应该妨碍我们去积极地了解、掌握进而应用AI大模型。认识AI大模型的局限性，正是为了更好地应用它。面对新技术的影响，如何冷静周全地协调各方面的关系，以切实助推史学的进步，是学术管理部门必须完成的重要作业。

（作者为浙大城市学院历史研究中心主任）