新闻动态

讲座纪要 | 林展:AI时代的历史研究

发布:2025-12-24 来源:

2025年12月18日,中国人民大学“人工智能与历史研究”通识讲座系列第7讲在人民大学通州校区公学二楼401教室举行。本次讲座由中国人民大学清史研究所副教授林展主讲,题目为《AI时代的历史研究》,数十位校内外师生参与。讲座聚焦人工智能技术如何赋能历史学研究方法,通过翔实案例展现了AI在史料处理、模式发现与理论构建中的应用。

图片 

AI能够突破人力处理史料的瓶颈。面对浩如烟海的档案、族谱、地方志等原始文献,传统的人工抄录与整理方式效率低下,难以满足现代学术研究对数据规模与分析深度的需求。林展老师以自身研究经历开篇,展示了一个系统化、可复制的古籍数字化处理流程,即“版面分析—OCR识别—利用大语言模型实现信息的结构化提取”,他合作的研究团队运用这种技术流程,成功处理了八千余部族谱、四千万余条个人信息,建成中国族谱数据库。这一技术发展极大地提升了从非结构化文本中提取信息的效率,将研究者从繁琐的摘录工作中解放出来。

图片 

接着林展老师介绍了一些借助AI技术取得研究范式创新的史学研究方向。例如历史人口学,基于族谱数据库与考古资料,研究团队能够绘制出中国过去一万年人口寿命变迁曲线,获得唐宋时期寿命显著提升、明清女性生育风险下降等新发现,为长期社会福利研究提供量化数据支撑。在政治史研究领域,已有研究通过机器通读分类30万份清末报纸,量化研究反满宣传的时空分布,证明清初镇压事件与革命动员的关联性。在文化史领域,还有学者合作开发的“情境化构念表征”分析框架,利用大模型分析古籍文本,构建“情境化构念表征”框架,量化评估集体主义、权威尊重等心理指标的历时性变化,为文化史研究开辟新径。

在展示技术优势的同时,林展老师也保持了学者的审慎。他指出技术应用的辩证性,AI不能替代研究者的批判性思维。他建议研究生积极学习AI工具,在史料编目、数据分析等环节提升效率,但需保留原始文本描述,对AI提取的结果进行抽样核查,确保数据的可靠性。

讲座最后,与会师生就生僻字识别、模型训练成本、数字人文伦理等问题进行了热烈交流。本次讲座展示了AI技术对重史料、强逻辑的历史研究的深度赋能,其核心理念是“需求驱动”,即技术服务于研究问题,而非为技术而技术。最终目标是实现“人机协同”——让机器承担重复性、机械性的信息提取工作,而研究者则专注于更高层次的分析、解读与理论建构。


(图/马致远 文/洪嘉珑)