*本文系国家社科基金项目“徽州民间文书抢救性保护与数据库建设研究”(项目编号:19BTQ010)研究成果。本文系《民间历史文献整理概论》序,本刊略有修改。
从故纸到文献
——刘志伟教授谈图书馆民间历史文献整理与研究
王蕾 叶湄 吴国良 韩宇
◆ ◆ ◆ ◆
2019年9月,在《民间历史文献整理概论》一稿初步修订完成的时候,中山大学图书馆副馆长王蕾组织与中山大学历史人类学研究中心主任刘志伟教授进行了一次学术采访,请他对书稿进行批评和指正,并对民间历史文献整理、数字开发、研究价值、资料利用方法、人才培养等问题提出指导性意见。刘教授的许多真知灼见,尤其是民间历史文献的界定和范围、文献与史学研究方法、数字人文开发与整理工作方法等是本书正文内容的补充和升华,提纲挈领地为民间历史文献整理与研究指出了方向。因此,本书撰著团队将访谈进行整理,并作为代序。
采访者包括王蕾、叶湄、吴国良,整理者包括吴国良、韩宇、叶湄。
问:刘老师,我们这本书题为《民间历史文献整理概论》。目前学界、文献整理界对“民间历史文献”仍有诸多不同的定义和理解,各地陆续发现了区域性的民间文献,如徽州文书、清水江文书、石仓契约。您认为民间历史文献是什么?有什么要点就可以将某一些文献叫做民间历史文献呢?
刘:历史学把一般史料归为两类:一类是别人写的历史,就是通常由他者书写,讲历史是怎么回事、历史发生了什么、经过怎么样、结果如何,这是在“写历史”;另一类是人们在历史活动中,通过文字处理生活工作中的事务,以完成历史活动,在实践中留下来的文字,这一类的文字内容更为丰富,跟刚才讲的“写历史”是两回事。通俗地说,我们在工作中,写的总结报告是一种史料,在日常工作中发出指示、填表、报账形成的文字是另一种史料。在实践中,借助文字来处理实际事务留下来的文字,和刻意用文字把已经发生的事情给记录下来,是两种不同的史料。
问:前者是第一手的、原始的史料吗?
刘:不是这样区分的,刚才讲的史料,都可以是第一手的。不能说写给我们学校的总结报告不是第一手的,但报告里写的是今年做了什么事,写的人要去想怎么讲更好、还要要求分几部分,这也可以是第一手的史料。另外一种是在做各种事情中,比如填表、信函、邮件、微信,这样留下来的文字更是第一手史料。所以,不是第一手史料还是第二手史料的问题。回到你们开始提出的问题,什么是民间文献?民间文献大多数情况下是这里说的第二种史料。在历史研究中,我们做社会经济史的,特别重视第二种史料,为什么?因为社会经济史研究的是各种社会关系、经济关系、社会现象和经济现象,都要看实际上人们怎样生活,怎么处理自己要面对的问题,用什么办法去处理,处理的时候发生了什么问题,又怎样去解决。要了解这些,不会由当时的人记录下来,大多数都要依赖分析在这些活动中所用的文字材料,这就是我们所说的民间文献。
史料学上把史料分有意识史料和无意识史料:有意识史料是刻意去写人怎么样,写事怎么样的历史资料;无意识史料原本不是写给别人看的,而是要处理某件事情必须书写的文件、填的表格、写的公函,或者发布的告示,这些都是为了处理当时的事务而产生的。民间历史文献主要属于无意识史料。我们能够从这种史料中看见或者能够从中探索人们的社会活动、经济活动、社会关系、经济关系,如果当时的人写了一大篇东西,讲了一通大道理,那我们还是不知道社会经济的实态是怎么回事。
问:民间历史文献与流传下来的官修文献有何不同?可以包括官文书么?
刘:如果是无意识史料,就不是官还是非官的区别。官文书也是官员胥吏在处理事情、处理公务时形成的东西,性质上还是与民间历史文献属于同样类型的文献。所以,广义地看,我们所说的民间文献,其实可以不只是非官府的,也可以包括官府的文书。
从文献学传统而言,民间历史文献有别于传统图书馆的收藏,传统图书馆一般不会收这些东西,所藏多是前面讲的有意识史料。四部之书,包括正式出版与抄本,大都是为了写书而写出来的。当然,其中一些如会要、官典章制度类文献也可以兼具有意识和无意识史料的属性。就其本身性质来说,它们是作为历史文献有意识写出来的,不是在实际操作中形成的,但我们也可以把官府立法过程、制定规章制度过程看成是个实践过程,那它们又具有这种无意识史料的性质了。
问:清宫档案属于哪一类史料?
刘:清宫档案属于第二种,作为史料,主要的性质跟民间文献是一样的。它原本就没准备给后人看,是各级官员之间、部门与部门之间来往的文字,这些文字不是在做历史书写,不是在记事,而是在办公。
问:既然很多档案可以看作民间历史文献,那么民间文献与档案又如何区分?
刘:广义地说,民间文献就是一种档案。但在档案系统里,就档案狭义的定义来说,一般是指政府部门形成和保存下来的文件。近年各地档案馆也注意收集民间文献了。档案原来指的是政府部门形成的公文书,私文书是不归入档案的。因此民间文献的叫法,有时候是相对于图书馆、档案馆原有的那套规范的收藏范围而言的。因为这些东西原来根本不入法眼,被认为没文化,又没有正确性,错字连篇,总之,不能登大雅之堂。
问:您认为有没有一个更好的名称来表述这类文献?
刘:我现在想不到用更好的名称,为什么呢?严格地说,所谓“民间文献”的概念不是很严谨的。首先,什么是民间?什么是官府?在传统中国,不是一个有清晰界线的分别。我们现在把某种文献叫做“民间”,只是相对于原来图书馆、档案馆的收藏而言。图书馆、档案馆原来的收藏范围很窄,这就意味着很多原本其实属于非民间的东西,也包含在“民间”里面。现在一般所谓的民间文献,其实很多是官方文件,也是政府发出的,只是它保存在民间,从我们获得的来源这些意义上,将其归到民间文献中。所以,我们把原来公藏机构不收藏的,来自于所谓老百姓手上的文书,都归为民间文献。
问:学界目前对徽州文书的断代下限,公认为是1949年,但我们收藏的这些文献里有大量是中华人民共和国成立后的文书,您觉得民间历史文献的时间下限如何界定?
刘:对历史学者来说,没有下限问题,因为历史本来就是一直延伸的。现在需要考虑下限问题,只是从收藏机构的工作策略而言。在这个意义上,我主张最好是下延到人民公社,不一定需要明确具体年份。到今天,人民公社时期的文献该重视起来了,因为这些文献正在丧失。对历史学者来说,当这些文献进入逐渐消失的阶段,收集整理这类文献就需要重视起来。一般来说,如果文献正在消失,就要开始重视收集,消失到很罕见的程度,就要建立起专藏。民间文献的时间下限是随着时代的发展不断往后延伸的,不应该设限。
问:中山大学图书馆还收藏有潮汕民间文献,如侨批,时间大多为1949年后,您认为它是民间历史文献吗?
刘:虽然目前侨批的界说还不是很清晰,但它依然可以算是民间历史文献的一种类型。民间历史文献的时间下限不一定要有明确的界定,很多时候只是眼前的策略,不要随便界定什么时间的才是民间历史文献。对文献学而言,我认为下限就是这一类文献已经在迅速地消失的时间。
历史不是处理保存记忆的,历史是处理“失忆”的。就是说大部分都失去了,我们就处理残存的那一部分,这是历史学者的任务。如果历史要处理记忆的话,根本无法处理那么多。事实上人类大部分活动都没有留下来,最后就是要看在历史过程中,什么留了下来,什么留下来还会对后世有影响,这套机制是怎么样的,然后从这里去把握一点历史的脉络,只能这样,也很无奈。
问:近代以来,随着科学发展,民间历史文献中出现很多关于科技的记录,这一类文献属于历史文献吗?比如20世纪初研究地理的一些地质资料。
刘:这些好像不能算,属于科技资料。民间历史文献主要是人们日常生产生活留下来的资料,严格说不应包含学术研究形成的资料,这类资料是一种比较独特的文献。比如,地质调查所的调查记录,民俗学、人类学的田野笔记,都不能当成民间历史文献,它们是专业研究实践产生的文献,反映的是专业活动。这类资料在一般意义上,与民间历史文献所反映出来的内容不同。当然,这里肯定有很多模棱两可、模糊不清的地方。一个科学家写给太太的信可以算是民间历史文献,而他在实验室的记录就不能算为民间历史文献,就看强调哪方面:如果这封信说了爱因斯坦的几句话,谈了一个科学的重大问题,那就是科学文献;但如果在信里谈这类科学话题,是同家人分享自己的工作生活和情感,那就是他的家庭生活或他个人生活的内容,那也就是所谓的民间文献。
问:历史学已经有科技史,是否需要研究民间文献?
刘:需要!因为科技史研究也必须要看科学家的人,他作为一个普通人的正常生活、社会交往,但从事科学活动的档案、笔记、科学报告属于科学文献。前面已经界定民间文献是在生活、生产过程中用文字去解决问题,处理相互关系而形成的文字记录,反映的是日常生活。比如,道教培养徒弟用的经典,本身是道教文献,而在我这里属于日常工具书,在这种情况下属于民间历史文献。再举一个例子,如果我桌子上摆着一本《毛主席语录》,它就是我的民间文献,但不等于《毛主席语录》是民间文献,也就是说,作为我日常使用到的《毛主席语录》是民间文献,不等于《毛主席语录》是民间文献,这个要分清楚。
问:民间历史文献收藏中包含法学类文献,如律法文书、投词、投状,这些文献该如何界定其资料属性?此外,试卷如何判定其民间文献的属性?
刘:投词等是在民间作为与人们生活相关的东西而保存下来的,它不是从学术角度有意识的写史料,因此应该算民间历史文献,但保存在衙门或司法机关的档案,比如已经出版的龙泉司法档案,它本身是司法档案,不能视为民间文献。不过,司法档案里面,常常也保存着在诉讼过程中作为证据的民间文书,当我们把它们作为资料来研究民间社会生活时,它们是民间文献;而当我们把它们作为诉讼证据来研究司法问题时,它们就是司法档案。关于试卷,试卷本身的存在,反映人们的日常生活、教育实践过程,可以是民间文献;但如果一位老师把学生的所有试卷都保留下来,我们用来研究教育史,那就是教育文献,就与民间文献有所区别了。
问:那这些文献要如何分类?是否要完全颠覆原来文献学的分类思想?
刘:文献如何分类不是我的专业范围,那是你们图书馆的事,但依我作为图书馆服务对象的角度来看,我想,建立民间文献分类体系,要在原来文献分类体系的基础上,建立起与民间文献相符合的范式和分类体系。比如,出现在民间文献中的四部之书可以全部归成一类,可以称为传统文献类或传世文件类,不要再细分经史子集,而且分类体系应具有较大的可扩展性。
问:一件文书从内容看可能属于多个类别,这种情况应怎么处理?
刘:文书有多重属性,这是不可避免的。你们馆正在整理徽州文书,但不要太局限于徽州文书,可以基于徽州文书整理提出一些想法,从这里发展出一种新的成体系的民间历史文献学构想或框架,这些构想或框架经过发展,最终到了某个时候能够成熟地、全面地涵盖所有区域的文书。
问:地方文献和民间历史文献有什么区别?民间文献属于地方文献么?
刘:民间文献当然是地方文献,但地方文献不等同于民间文献。所谓地方文献,就是在一个地方产生形成,并且是关于这个地方的政治、社会、经济、文化、历史、地理、人群的文献,涵盖的文献很广泛。地方文献是相对于国家典籍而言的,涵盖了民间文献。最典型、最有代表性的地方文献是地方志,或者地方人士的诗文集之类。这些肯定不是民间文献,但民间文献肯定是地方文献。
问:全国各地都有区域性的民间历史文献,是否可能开展对比研究或整体研究?
刘:目前还没有,或者说这种研究还不成气候。很多收藏和研究单位还处于收集整理的过程,都在探索各个地方收集的民间文献可以做些什么研究。目前做得较好的是石仓契约、清水江文书。互相之间的比较或互相之间建立某种相关性或整体性研究,条件还不具备。当然,目前整理研究成果最丰富的还是徽州文书。学界用徽州文书做的研究已经涉及很多领域,包括日本、欧美、中国不同学科的学者都做出了很多贡献,研究成果的规模、研究视野、牵涉问题的深度和广度都领先于其他区域的文书。很多其他地方的民间文献研究,或多或少,或有意识或潜意识,都有在徽州文书研究的基础上,或以徽州文书的研究作为参照。但这一点,还不能说已经有很明显的自觉。
问:傅衣凌先生在《福建佃农经济史丛考》序言中提出社会经济史研究要有社会科学的概念,要找民间的资料,要做社会调查。您认为民间历史文献对经济史研究的核心价值是什么?
刘:价值就是它反映的是实际的生活,是在现实中人与人之间产生关系,是处理某件特定的事情时形成的文字。在这一点上,它是真实的。但是,用语言文字去处理实际问题的时候,可能是通过说一大堆谎话达到目标的。比如,写一封信可以编造一大堆东西,但为什么要编造这套东西呢?背后一定有动机和目的,用这种表述方式写出来而达到某种目的,收到写信人希望的效果,这点是最真实的。因此,民间文书的价值,不一定是看里面的内容是真实还是不真实,对这一类文书来说,真实性不在于文字表达的内容,而在于它是在实际生活中处理现实的问题,这点是真实的。就算通篇谎言,一定有某种目的,一定是在处理某种关系。所以,对社会经济史来说,为什么特别重视民间文献?因为社会历史研究的是人们实际社会经济的关系和他们的活动,只有在这里才能够得到第一手的直接的材料。
问:那么,使用民间历史文献应该把握什么方法和原则?与以往历史学所使用的官修文献的解读有哪些不一样的地方?
刘:首先要明白民间历史文献是在人们的实际生活过程中产生的,这些文书处理的是现实生活中的问题,是人们当时要面对、要处理,还要用当时有效的办法去处理的问题。里面的内容讲了什么,应该放在这样一个角度去分析和处理,而不只是对内容做简单的复述,这是最基本的,跟用一般的历史文献是更多依据其中讲述的事实不一样。其实,所有历史文献从史学方法来说也需要采用这个角度,但大部分情况下,还是把它的记载当成是对事实的记录或描述,所以那时候才有用不同文献讲述的事实互相印证的问题。民间历史文献一般不是从互证角度去使用。人家当时就是用这种文字书写去处理他要处理的事情,由不得我们去评判正确与否。比如,契约就是两家或两家以上发生经济关系的时候,用这种方式来定义和界定他们的经济关系。再如,账本就是当时人们需要把账目记录下来,至于账目记得准不准,是没办法印证的,就算有印证又怎么样呢?说这个人做假账,但做假账也是为了某种目的去做的嘛,这就是历史事实。
我们现在有些研究是拿一件或几件文书去解读,印证某种观点,这其实就是把民间文献跟普通文献用同样的方式去处理。比如,最常见的契约,契约上讲了一些什么概念,讲了什么关系,就拿着这个来发挥。但是,对民间文献,既然在理想情况下它是在实际生活里,面对实际的问题而形成的文字,就尽量要回到它的现场。当然,要真的回去是不可能的,时间回不去,但至少空间要设法进入,然后要通过自己的想象力和一种同情的理解,要让自己身处其境,尽可能去理解当时这样做是在处理什么事情、为什么这样去处理、用这个契约处理这种关系为什么是有效的。也就是要把自己拉回到历史现场。
问:在长期的徽学研究中,因为学者获取资料的局限性,只看到十几件几十件可能有关联的文献中的一件,针对这一件做研究,并且有了结论。在过去的徽学研究里,是不是存在很大的问题?
刘:这些问题在学术研究里面是不可避免的。因为对历史学者来说,永远面对的都只是能得到的材料,其实都是零碎的,不可能有完整性的。完整性只是一个理想的追求,我们追求整体,追求关联性,但有多少材料说多少话。不过,要避免的是,单纯拿着文书望文生义,因为这样的话,跟拿着传统的史籍解读,在方法上还是一样的。
我们在研究中面对的问题,不在于多件还是单件,而在于文献之间是不是有关联。文书本身的关联性非常重要。历史学者很多时候受限于史料的缺失,做研究时,常常把没有关联的两个文书放在一起。比如,这个人的书里面有几句话这样讲,那个人的书里面有几句话这样讲,拿来互证,但是,哪怕他们讲的是一模一样的话,也不一定是在处理同一件事,不是处理同样的问题,牵涉的主体、目的和动机也不一样,把它们放在一起,往往得出来的解释,只是想当然的解释。
问:您认为徽州区域史研究目前处于什么样的发展情况?
刘:这个比较难讲,因为不同的人做的事不一样。早期就是1980年代或1990年代前,基本上社会经济史是搞清楚文书里的一些基本概念,包括租佃关系、土地买卖以及里面反映出来的土地占有状况,后来慢慢转到关注一些社会组织、社会人的关系,现在开始关注的比较重要的包括女性、宗教活动、信仰等,但这些都是很初步的。现在最大的问题是没有把这些文书真真正正地带回到历史现场,回到特定时空去解释,当然这个太难了,只能一步步来。
问:您刚说1980年代时通过契约已经研究了一些背后的制度关系,那么,现在文书中大部分都是契约,是否已经没有具有价值的研究空间了呢?
刘:有没有价值,一方面要看你提出问题的是什么。比如,1990年代后,受现实关怀以及制度经济学影响,比较重视产权问题。产权问题在1980年代前多数是一个土地所有制和土地集中程度的问题等,但现在大家都会注意这些产权的形态。随着提出问题的不一样,会有新的价值。但是,这些新的价值在学术上是不是有意义,有多大的研究前景,要在实践中慢慢探索。比如,刚才讲到的女性问题,现在契约里面出现的这些女性的角色的价值很多时候是可以不断地被发掘出来的。而且,随着文书收集数量越来越大,特别是现在学界普遍重视文书的归户性,最近又有学者提出归群角度,都是越来越重视文书内在的联系、系统性跟内在脉络,这样的话就会有新问题发掘出来,新问题的空间和这个前景就越来越大。在这种情况下,很难说它的价值已经被发掘尽了。
一方面是我们不断有新的问题意识,而且这些问题意识也会转变,另一方面是文书本身的多样性也在增加。文书收藏量达到一定规模后,就可能呈现出一些可以找到内在联系的东西。当数量足够大以后,从统计学方法来看,一定会有新的空间可以发展出来。而且契约文书不但反映契约本身,还跟别的文书有关系。随着文书数量增多,特别是随着数字化、数字人文发展,还可以提出新的问题,所以前景是很可观的。
总而言之,因为文书是实际生活中处理实际问题形成的文字,所以对我们了解它产生时的社会、人群、时间、地方等方面会随着文书数量的增多以及种类的多样性,会有不同的价值空间发展起来。
问:我们应该如何尽可能去靠近历史现场?如果要走进历史现场,做田野调查,我们应该重点做哪几方面的事情?
刘:历史现场有很多种,很多层次。一个当然是回到文书所在的地方,尽管时移世易,物是人非,现场已经变化,但是那里的生态环境不是可以在文书里面直接体现出来的,还是需要到现场去认识和体验。再就是那里的人,虽然是现代的人,但是那些人在那个地方继承着一代一代留下来的遗产,各种各样的遗产、观念、习俗以及做事的方式都是做研究要了解的内容。应该跟当地的老百姓合作,要走进的历史现场是走到老百姓那里去,而不是只和当地的学者或研究中心进行交流了解。
不过,我觉得这是历史学者的责任,图书馆的文献工作就不一定非要去做这些了。图书馆等收藏机构的重点就是确认和记录文书的来源地,尽可能搞清楚文书流传途径,这已经很好了。
问:关于文献来源地,除文本与可能的收藏历史,现在只能通过这两条途径去了解吗?
刘:基本上是,这些能了解多少就算多少吧。只要能够提供一些辅助性的帮助就可以给研究提供很大的助力了。比如,研究者拿到资料,就能知道资料的来源、存在形态、一些专有名词或人名地名信息、确定文献的空间和时间等。
问:针对这个问题,如果面对历史学者或历史系学生,您怎样回答?
刘:要看他想做什么研究。因为不同的研究,关心的问题不一样,希望解决的问题和需要建立起的解说也不一样。
问:厦门大学郑振满教授提出的民间历史文献学是指什么?从图书馆等公藏机构角度来说,民间历史文献学应该是什么样的定义或概念?
刘:郑振满教授主张用民间文献来研究解读历史,他的“民间历史文献学”其实更多是解读民间文献的学问,而图书馆应该是借助历史研究成果来整理研究文献。比如契约,已经有很多研究,大概知道契约的基本特性、类别,以及契约上文字内容的表达方式、词语的内涵,据此可以进行一定的整理和著录。但是,人物关系就不是图书馆能处理的,民间文献里很多人物名不见经传,同一个人有不同的名字写法,同样的名字有不同的人。传统文献学也有这种问题,但它有很多线索可以去追查,民间文献整理,传统方法常常无能为力。
问:您是否反对图书馆作为文献整理者参与历史研究?
刘:你们不要太多参与历史研究,但是,时时处处要有历史研究的眼光和学术关怀,要和历史研究有对话。图书馆作为公藏机构,主要是在文献学方面着力,在徽州文书整理成果的基础上,逐渐形成一套适用于民间文献学的研究方法,建立起一套体系。历史学在研究过程中,也会在文献学方面形成很多思考,也有很多经验,也会提出问题,这些问题其实也是对文献学和图书馆提出的一些要求、期待或需求。所以,在这个过程中,公藏机构需要持续地跟历史学者进行对话,虽然各自有学科范式和话语系统,但在很多实质的内容上、思路上可以有启发的。不过,你们一定要坚持图书文献学本位。
问:除了用历史方法来整理民间历史文献,您认为民间历史文献学和传统文献学的区别是什么?
刘:比如说民间历史文献分类,也就是目录学问题,跟传统文献肯定不一样,元数据的体系也不一致,必须建立另一套分类法。最基础的是民间历史文献要依据其特性和历史研究的成果、方法来整理,在整理过程中建立起规范。
问:民间历史文献分类借鉴了很多图书馆学、档案学、目录学原有的分类方法,对此您的看法是什么?
刘:这个是可以的。一方面要借鉴,因为民间历史文献学不可能离开原有学科范式,但又不同于传统文献学,必须有另外一套规范和系统,两者之间并不矛盾。
问:所以民间历史文献学依然需要借鉴传统文献学吗?
刘:借鉴的说法不准确,是要在原来的范式下建立起一个适合呈现民间历史文献特性的体系,但这个体系的每一个部分,每一个类别,可能都跟传统文献学不一样。这两者之间既有关联,又有所不同。任何一门学科,无论如何革新,都不能从头开始另起炉灶,否则会杂乱无章,使人难以理解,始终要扎根在原有的学科范式里。
问:您认为《民间历史文献整理概论》的主要价值有哪几方面?
刘:比较系统,比较有体系、有整体性,尤其是刚才讲的文献学问题。
问:接下来想就数字化和整理工作问题向您请教。郑振满教授带领的团队在做民间文献的数字化工作,您是否了解,可否介绍一下经验?他们主要做哪些区域文献的数字化?
刘:他们的作法挺好,主要在福建永泰地区。他领着一群学生带着扫描设备到村里。我跟着他们进去村里,亲眼看见他们找了两三户人家把文书拿出来,一个村子几千件文书,完完整整的就是原来箱子或竹篓的样子,他们马上在那里拍照扫描。
问:如果从不同视角来看待问题,比如从收藏角度和长期保存角度来看待的话,这些做法是否对文献本身没有得到足够的保护?
刘:我不是说拿到什么,而是他搜集到的文书,从完整性、在地性、数量上,其他地方没法比。我跟他走了三五个乡村,就已经收集了数千件文书。据说他们在永泰县已经收集到了数以万计的文书。他们每次去一个村就几天,就有这样的规模,令人妒忌!但是,我们也有比他有优势的地方,他们图书馆的人没有直接参与,而我们图书馆有专藏库。保护方面,当那些文书在村子消失了的时候,那些数字化的图像资料,本身就是文献。现在很多地方,那些文书还是老百姓家里的宝贝,人家不会给你带走。你想带走,人家根本不给你看,更别说拍照扫描。
问:在大数据时代,民间历史文献开发与研究有哪些新方向?
刘:你是讲远景还是讲眼前?谈远景的话,其实只能是一些梦想,因为现在没有这套工具,还没有这样的理想平台。我的梦想主要是在云计算层次,我期望有一个没有边界的,可以建立无限关联性的数据空间,这是一个无限大的系统。现在史学界所谓的大数据,其实全部是微量数据,真正的大数据是每一秒钟都数以亿万计的数据产生,是一个只靠人力无法把握的数据变量。历史学不只是处理清代以前的历史,如今高德地图、百度地图每天的交通信息,未来也是历史数据,而且肯定是大数据。未来所谓的数字化历史学的任务,不是处理书写排版活字印刷时代的历史,而是需要处理用数字化的整套工具去生活,去处理现实问题的历史。也就是说,现在努力去推动数字人文,是为了50年100年后的历史学者有一套办法,有一套历史学的手段研究我们今天的历史。
问:目前民间历史文献的研究能否用到大数据技术?
刘:能用到。民间历史文献以后最大量的,起码现在可知道的最典型的民间文献就是微信上的信息。目前的数字人文是为以后历史学或者历史文献学或者文献学发展而进行的最初步的探索,我们必须从零开始,从人力有可能处理的数据开始。历史学也应该把现在收集到的这些历史文献进行数字化,再建立数据库,慢慢发展起来,一步一步到了50年后,就有可能处理现在微信一类传播媒体形成的数据了。如果我们现在不开始探索,人文学科连这种意识都没有,不从零开始,不从基础数据开始,那以后人文学科就失去解释我们自己的社会文化的能力了。
问:请您谈谈民间历史文献数据化需要注意的问题。
刘:数据化不能够作为一件事情一揽子完成。目前我最关心的,第一是编目整理,就是如何尽量保存文献之间的系统性与相关性,这是最基础性,最前提性的事。第二,文书的保护,文书作为物质载体的保护。文书进行图像数字化后就可以避免在整理利用过程中的损坏,减少直接接触文书的次数,尽可能保护文书原件,这也是比较迫切的。第三,利用的方便。如此大量的文书,如果都用调阅原件的方式,利用起来很不方便。前面三点都可以用数字化图像方式来实现,还要有一个目录索引系统。
当然,这几个还都是很初级的,真正的数据化目前达不到。那么理想中的数字化当然是全文录入,但在目前还做不到的时候,也许可以用提要方式,或者多加一些关键词检索。建立全文数据库耗时耗力,单就中山大学图书馆这批文书来说,已经是一个巨大的工程,而只有建立全文数据库,才真正谈得上数字化。民间文献的全文录入和档案或者传世文献的录入是不一样,涉及文字辨认,异体字处理,复杂格式处理,这些都是很难解决问题,需要长期探索,所以数字化一定是一个长期工作。全文数据库建立后,就要建立各种计算平台,但这需要利用民间文件的学者的研究能够跟得上。现在最大的困难是学界的研究无法跟上发展的需要,学界对什么是数字化还没弄清楚,懂数字化的不懂历史,懂历史的不懂数字化,这是困境。
问:您如何评价中山大学图书馆在徽州文书整理与研究方面的工作?
刘:我前面说过,学界在徽州文书领域已经耕耘多年,像栾成显、周绍泉、刘伯山、曹树基、王振忠等学者,他们有非常好的学术见地、学术眼光和学术素养,为徽州文书整理研究工作奠定了非常好的基础。在他们的基础上,你们能从一个公藏机构整理者的角度出发,从文献整理、文献学角度出发做一些徽州文书的整理研究,这也是一种很好的研究尝试和学术贡献。
问:古籍、碑帖、文物都有全国性普查活动,您认为民间历史文献有没有必要做全国性普查?
刘:清代以前的文书,非常有必要,但比较困难,因为民间文献还没得到足够的重视。从鼓吹到实践,至今已经超过100年,还是步履维艰,只能不断呼吁,走一步算一步,这是一个漫长的过程。
问:中山大学图书馆藏徽州文书多数是从老百姓手里收集来的,不管原来是否属于官府,但缺少华南区域史研究中关注的当地的碑刻、遗迹,这部分东西是否要补充?
刘:作为徽州文书整理文献学的研究,不一定要做到这么完整。从理想状态来说,研究者应该自己收集。比如,图书馆传统四部之书的收藏,能够为研究者着想,把所有版本都收集齐么?
问:在数字人文趋势下,资料越多的话,发现的历史脉络关系会更容易、更清晰吗?
刘:理论上当然没有错。但现在在这点上还缺乏太多共识,因为最基本的、海量的文献资源是需要有一个没有边界的网络。平时所谓的云端,更多是强调没边界,是无限扩大的。要用同样的结构去建立数据库平台和计算平台,计算平台可以变,但我认为能够共享的数据库平台建设才是当务之急,这可能是最难做到的,在实践中能做到的就是大家都各做各的。现在不要说民间文献,图书馆文献的那些数据库也是各做各的,那些方志库是永远都不可能打通。
问:对民间历史文献来说,人才培养、整理队伍应该具备哪些专业素养或知识?
刘:文献学知识是基础,也需要有其他学科尤其是历史学素养,还可以有一定民俗学、人类学、宗教学、法学知识。不一定需要图书馆有这些人,但需要有这些学科的学者做支撑,包括咨询和指导。
文章来源:《图书馆论坛》2020年第3期
作者简介:王蕾,博士,中山大学图书馆副馆
|