赵思渊:人工智能推动历史学研究范式更新_人工智能_汗青学
提升史料释读
ChatGPT等通用人工智能紧张被视作“大型措辞模型”(large language model),其基本事理因此大规模的自然措辞数据对人工智能进行演习,并通过人工监督与机器监督对人工智能的语义理解供应反馈,从而令人工智能根据人类的输出指令拟合并反馈符合人类语义的内容。这也即所谓的天生式人工智能。近年来兴起的天生式人工智能之以是表现出令人印象深刻的自然措辞理解能力,是由于不断更新的算力设备使得人工智能能够打算更多的参数,从而更贴近对自然措辞与社会环境的仿照。ChatGPT等天生式人工智能的参数量均在百亿级以上。
自天生式人工智能兴起以来,历史学研究已经在两方面进行了探索。一是史学理论层面。天生式人工智能是否能够自主地提出历史认识论,或者寻衅我们既有的历史认识论?二是天生式人工智能的各种运用办法在哪些方面会改变既有的历史学研究方法?
关于以上问题,我们的初步回答有两点。第一是天生式人工智能还不能自主地提出历史认识论。有的历史学家向ChatGPT提问“历史学是否是科学?”ChatGPT只能反馈来自常见历史学理论著作中的范例阐明。受到既有监督学习策略的影响,天生式人工智能在回答认识论类型的问题时更为守旧。但也有的历史学家提出警示,天生式人工智能天生的文本已经很难差异于人类书写的文本,这将对未来的历史学家提出严厉寻衅。
第二是人工智能为历史学家供应了更有效的文本挖掘、比勘史料、公共历史实践的事情方法。人工智能能够很好地理解自然措辞,可以进行大规模史料的“鸟瞰式”处理。其一是文本挖掘。人工智能能够快速扫描大量文本,识别关键词、主题和人物关系,帮助学者创造传统方法难以察觉的线索。例如,研究职员可以通过演习NLP模型,从成千上万封历史人物的信件中自动提取关键信息,剖析他们的思想和人际交往网络。其二是根本史收拾解。随着图像识别技能的发展,人工智能可以赞助识别和解读古代文献中的繁芜笔墨。一些研究团队正在开拓人工智能模型,可以自动识别甲骨文和敦煌文书,帮助历史学家更深入地理解这些宝贵史料。其三是文本情绪剖析。人工智能能够剖析文本中的情绪方向,帮助历史学家理解历史人物的生理状态和社会舆论走向。如研究职员可以通过演习人工智能模型,剖析奏折、书信等文献中所表达的感情。
历史研究的主要赞助工具
历史学研究不仅须要对史料进行释读,更主要的是创造史料之间的关联。那么,人工智能能否为史料的比对与关联剖析供应帮助呢?答案是肯定的。首先,人工智能能够创造不同历史资料之间的潜在关联,帮助学者构建更加完全的历史图景。如研究者可以通过给出详细的提示词,利用人工智能帮助比较不同的史料系统,从中创造差异与关联。其次,人工智能也更善于从大规模文本中识别与提取可剖析的数据。如将史估中以笔墨描述的数字转写为可打算的数据序列,或者对史估中涌现的年份、计量单位等进行换算,又或者对史估中涌现的人名、地名、职官名等进行统计、标记,乃至自动查考。不过,这一过程也对研究者提出了更高哀求,即研究者必须把稳到天生式人工智能在进行文本的关联探索方面可能存在的事实缺点,从而更谨慎地面对这些天生内容。与此同时,研究者也须要学习更多的提示词技巧,以提高天生内容的效用与准确性。
在史料编纂与可视化方面,人工智能也能为历史学研究供应更多帮助。在既有的数字人文研究中,构建知识图谱是将史估中的人物、事宜、空间、制度等信息进行关联与再剖析的通用方法。对不少历史研究者来说,构建知识图谱存在一定的知识门槛,也须要更多的人力投入。而天生式人工智能可以在恰当的提示词勾引下,较为便捷地完成这一事情。
此外,利用人工智能进行“历史仿照”也正在成为历史学传授教化与公共历史实践积极探索的方向。加州大学圣克鲁斯分校的历史学家本杰明·布林就将天生式人工智能引入教室,通过在人工智能中置入干系史料并调度参数,学生可以仿照某个详细历史情景中的人物,在做出不同决策时得到不同的反馈,而这些反馈则依据相应的史料天生。
简言之,人工智能在处理史料的数据提取、统计剖析以及语义理解方面展现出了强大的潜力。它可以快速、准确地处理大量非构造化文本,进行信息提取、关联剖析等,从而为历史学研究供应有代价的赞助工具。通过模式识别和统计剖析,它能够从文本中创造信息并作出推测,乃至能够进行一定程度的史料解读。
但值得把稳的是,史料学仍旧是历史学事情方法的核心。利用者知道如何利用准确的提示词勾引人工智能完成史料考证事情,先决条件仍旧是他已经受过完全的历史学方法演习。并且这还须要利用者具有史料搜集能力——这在很多历史学研究过程中恐怕是运气、史识与勤奋的结合——以便给人工智能供应更多通用演习数据之外的资料进行逻辑推断。
与历史学研究良性互动
人工智能为历史学研究供应的增益显而易见,但历史学家在人工智能环境中还有很多须要探索的事情方法,以及须要负责对待的寻衅。与人工智能在其他领域的运用一样,天生式人工智能并不能对历史学干系输出内容的真实性进行考验,并且这些天生内容大多与既有的学术文献存在某种关联。因此,研究者在利用人工智能的天生内容时,须要在真实性考验方面更为谨慎。同时也须要考虑学术伦理问题,不仅是避免由此可能造成的不当引用,也包括人工智能天生内容如果置入学术文本可能存在的伦理风险。科学期刊Nature在2023年即揭橥专文谈论了天生式人工智能运用于学术研究可能引发的伦理风险。这方面的问题同样值得人文学者思考。
此外,天生式人工智能的确能够提升历史学的研究效能,历史学界有必要探索面向全体学术共同体的研究技能,令天生式人工智能真正帮助历史学的发展。2023年至今,***“中研院”近代史研究所郭廷以图书馆上线了系列研究指南《历史学者如何运用ChatGPT》,分别从历史传授教化与赞助研究两方面列举了诸多运用实例。这是值得借鉴的履历。同时,在家当界与自然科学界,针对一些较为常见的运用处景构建通用提示词,已成为日渐盛行的做法。好的提示词集既能有效赞助历史学研究,也能在历史传授教化中发挥浸染。干系高校与科研机构应尽快发布面向历史学研究的专用研究指南与提示词集, 从而推动人工智能发展与历史学研究的良性互动。
总之,天生式人工智能对家当发展与学术研究的影响无远弗届,历史学自然不可能置身事外。过去两年学界的探索也显示出生成式人工智能的确能在史料处理与历史传授教化方面发挥相称大的效用。但毫无疑问的是,面向历史提出故意义的问题,从人类社会的主体性出发探究历史,须要历史学家发挥其史识与史才。这也是人工智能时期历史学家特殊值得思考的问题。
作者:
赵思渊
上海交通大学
人文学院历史系教授
本文系作者个人观点,不代表本站立场,转载请注明出处!