“喚醒”古籍!探訪文溯閣《四庫全書》數(shù)字化影印出版工程(人民眼·讓文物活起來③)
圖①:讀者古籍?dāng)?shù)字科技中心工作人員對文溯閣《四庫全書》數(shù)字化文件進(jìn)行質(zhì)檢。本報(bào)記者 王錦濤攝 圖②:甘肅省圖書館依托文溯閣《四庫全書》開發(fā)的文創(chuàng)產(chǎn)品。圖③:甘肅省圖書館文溯閣《四庫全書》藏書館工作人員巡查書庫。圖②③均為甘肅省圖書館提供 圖④:甘肅省圖書館文溯閣《四庫全書》藏書館主樓。本報(bào)記者 王錦濤攝引 子登臨蘭州北山九州臺,甘肅省圖書館文溯閣《四庫全書》藏書館躍入眼簾——館樓飛檐翹角,踞北山而瞰黃河。自正門入樓,穿鞋套,做登記,進(jìn)書庫。書庫恒溫恒濕,1128個(gè)香樟木書箱層層疊疊,收錄典籍6141函、3474種、36315冊的文溯閣《四庫全書》就安放于箱中。2023年6月,習(xí)近平總書記在中國國家版本館中央總館考察調(diào)研時(shí),詳細(xì)聽取《四庫全書》版本源流、紙張印刷、保護(hù)收藏等介紹,叮囑工作人員:“我最關(guān)心的就是中華文明歷經(jīng)滄桑留下的最寶貴的東西。中華民族的一些典籍在歲月侵蝕中已經(jīng)失去了不少,留下來的這些瑰寶一定要千方百計(jì)呵護(hù)好、珍惜好,把我們這個(gè)世界上唯一沒有中斷的文明繼續(xù)傳承下去。”《四庫全書》編纂于清代乾隆年間,是我國歷史上規(guī)模最大的叢書,修成后謄抄7部,分藏于紫禁城文淵閣、圓明園文源閣、盛京(今沈陽)文溯閣、承德避暑山莊文津閣、杭州文瀾閣等地。目前存世三部半,分別為文淵閣本、文溯閣本、文津閣本,以及被稱為“半部”的文瀾閣殘本。其中,文溯閣本輾轉(zhuǎn)多地,于2006年入藏現(xiàn)在的藏書館,也是“三部半”中唯一尚未完整影印出版的一部。為了讓書寫在古籍里的文字活起來,經(jīng)過長期縝密的籌劃論證,2021年8月,甘肅省正式啟動文溯閣《四庫全書》數(shù)字化影印出版工程。目前,文溯閣《四庫全書》數(shù)字采集工作已全部完成,數(shù)據(jù)處理工作完成70%。從現(xiàn)在起至2028年,文溯閣《四庫全書》將按經(jīng)、史、子、集四部,分期分批推出全套影印版本。數(shù)字采集采集方案、流程規(guī)范和相關(guān)作業(yè)標(biāo)準(zhǔn)周密完善約8億字的文溯閣《四庫全書》共有多少頁?數(shù)字化之前鮮有人知。“換算為現(xiàn)代書籍頁碼,共488萬多頁。”文溯閣《四庫全書》數(shù)字化影印出版專職工作組組長宋學(xué)娟說。作為讀者出版集團(tuán)有限公司所屬的讀者古籍?dāng)?shù)字科技中心總經(jīng)理,宋學(xué)娟過去兩年多時(shí)間帶領(lǐng)團(tuán)隊(duì)把文溯閣《四庫全書》從紙上“搬進(jìn)”了電腦——逐頁掃描、存入,數(shù)據(jù)資源總量逾700TB(太字節(jié))。“如果用常見的容量32GB的U盤存儲,需要2.2萬多個(gè)才能裝下。”宋學(xué)娟說。文溯閣《四庫全書》既是歷史典籍,又是珍貴文物。若藏于高閣,難以活化利用;若活化利用,又有損壞之虞。如何破解“藏”“用”兩難?2021年8月,甘肅省委宣傳部制定《文溯閣〈四庫全書〉數(shù)字化影印出版工作重啟方案》,力求在保護(hù)的同時(shí)“喚醒”古籍。古籍真本由甘肅省圖書館提供,數(shù)據(jù)采集處理、影印出版等工作由讀者出版集團(tuán)有限公司具體實(shí)施。數(shù)字化影印出版工程分為“數(shù)字采集—數(shù)據(jù)處理—影印出版及數(shù)據(jù)庫建設(shè)”3個(gè)階段。所需經(jīng)費(fèi),部分由中央文化產(chǎn)業(yè)發(fā)展專項(xiàng)資金、甘肅省財(cái)政資助,部分由讀者出版集團(tuán)有限公司自籌。數(shù)字采集,免不了要接觸古籍真本,如何確保其安全無損?甘肅省圖書館和讀者出版集團(tuán)有限公司制定了周密完善的采集方案、流程規(guī)范和相關(guān)作業(yè)標(biāo)準(zhǔn),“54條數(shù)字化工作流程規(guī)定,涵蓋前期準(zhǔn)備、文獻(xiàn)出庫、數(shù)據(jù)處理等全部流程。”宋學(xué)娟介紹。為保古籍安全萬無一失,文溯閣《四庫全書》藏書館二樓會議室被改造成了數(shù)字采集室,做到原書“出庫不出館”。而從書庫到采集室,平常不到一分鐘的路程,藏書館90后館員魏喬波卻要走好幾分鐘:戴上白色手套,細(xì)查一遍即將出庫的古籍,再輕輕捧起,就像捧著一碗不能灑出的水,慢慢往樓上“移”,“就怕腳下不穩(wěn)”。“古籍出庫,要填報(bào)11類表格,層層審批。歸還時(shí),所有細(xì)節(jié)都要對得上。”魏喬波說,以其中的《提書登記表》為例,提取古籍需詳細(xì)填報(bào)當(dāng)日采集計(jì)劃、提取數(shù)量,然后與書庫管理員共同清點(diǎn)每一函、每一冊書,包括函盒、夾板、束帶、銅扣的存缺程度,每一冊古籍的題名、卷數(shù)、頁數(shù),以及有無破損、污跡或霉斑等情況,“這些都要一一記錄在案。一送一回路上、數(shù)據(jù)采集期間,古籍若有半點(diǎn)閃失,都會被及時(shí)發(fā)現(xiàn)。”數(shù)字采集作業(yè)班班長楊旭勇告訴記者,采集時(shí)必須使用古籍專用非接觸式掃描儀高清掃描,且光源必須是冷光源。對采集人員,甘肅省圖書館的古籍專家也開展了多輪培訓(xùn)演練,“既要保證掃描精度與進(jìn)度,還要避免傷害古籍,翻書的力道不能輕也不能重,要穩(wěn)而有力。”楊旭勇說。準(zhǔn)備周密,工作前期進(jìn)展順利,意料不到的問題還是出現(xiàn)了。“古籍開本大小相同,厚薄卻不一樣。”宋學(xué)娟翻開一本書,拿到一臺掃描儀前比劃道,“超3厘米厚的古籍,用這種平板掃描儀掃描,靠近訂口的部分內(nèi)容很難被有效采集。”為啥?不按壓,無法掃描;按壓,古籍易損,且采集到的內(nèi)容會變形。怎么辦?“為保證采集質(zhì)量,我們追加預(yù)算,在已采購10臺古籍專用平板掃描儀的基礎(chǔ)上,又購置了兩臺V型古籍掃描儀。”宋學(xué)娟說,使用這種掃描儀,只需將書翻開到90度,即可完成掃描采集,問題迎刃而解。2021年12月23日,開機(jī)掃描;2022年5月23日,采集告竣。“整整5個(gè)月,經(jīng)過人員倒班,實(shí)現(xiàn)每天工作16個(gè)小時(shí)、一天未休。古籍沒有絲毫受損,函盒沒有增加一道劃痕。”陽光透過窗口,灑在黃底黑字的《文溯閣〈四庫全書〉數(shù)字化工作手冊》上,宋學(xué)娟長舒一口氣。數(shù)據(jù)處理數(shù)字文件與古籍真本如同孿生,最大程度呈現(xiàn)古籍原貌偌大的房間里,數(shù)十名工作人員神情專注、緊盯屏幕,只聽見鍵盤敲擊聲此起彼伏。在讀者古籍?dāng)?shù)字科技中心的數(shù)據(jù)處理室,采集來的文溯閣《四庫全書》數(shù)據(jù),將被加工成標(biāo)準(zhǔn)的數(shù)字文件,供后續(xù)影印出版和數(shù)據(jù)庫建設(shè)之用。“數(shù)據(jù)處理有4道流程,圖版處理、一校、二校和質(zhì)檢存儲。”宋學(xué)娟介紹,其中圖版處理是關(guān)鍵,主要工作是拼接完整“葉”。葉,古籍特有的量詞。不同于現(xiàn)代書籍,古代紙張多為單面印刷,一張紙即為一葉,書冊由一葉一葉對折后裝訂而成。一葉,相當(dāng)于現(xiàn)代書籍的兩頁。所以,數(shù)字采集到的掃描件實(shí)則都是半葉,圖版處理就是讓它們合二為一。“最初,我們先在電腦上制作一個(gè)標(biāo)準(zhǔn)葉模板,再利用智能軟件,從掃描件上提取文字,貼在模板上。”宋學(xué)娟告訴記者,但實(shí)際操作中發(fā)現(xiàn),智能軟件可能會漏字、識錯字,且原本每一葉的版式不盡相同,模板統(tǒng)一后,有“失真”之嫌。數(shù)字文件與古籍真本,如何保持孿生一般的相同面貌?“我們摒棄了標(biāo)準(zhǔn)模板,選擇了逐葉拼接,最大程度呈現(xiàn)古籍原貌。”宋學(xué)娟說。圖版處理不易,校對任務(wù)也很繁重。文溯閣《四庫全書》數(shù)據(jù)校對人員張靜從事古籍校對工作已有10年,但從未校對過如此海量內(nèi)容。利用數(shù)字技術(shù)能夠提速,但一些訛誤很難被發(fā)現(xiàn)。不久前,張靜在校對時(shí)發(fā)現(xiàn),一個(gè)“丸”字疑為“九”字。經(jīng)仔細(xì)核校后確認(rèn),果然是因?yàn)楣偶埨锏闹参锢w維發(fā)生霉變,掃描時(shí)多出了這一“點(diǎn)”。起初,一天校對300葉是張靜的上限。“剛開始時(shí)平均用力,耗時(shí)較多。”她說,而今這個(gè)數(shù)字翻了近3倍,“慢慢地,哪里容易出錯、哪里容易變色,心里都有了數(shù),效率提高不少。”效率高了,膽子卻小了。“總擔(dān)心有錯誤沒能及時(shí)發(fā)現(xiàn)。”張靜回憶,有次下樓吃午餐,飯剛端上來,她又起身趕忙回到辦公室,“以為忘了標(biāo)注一處訛誤,打開電腦一看,其實(shí)已經(jīng)做了記錄。”為明確權(quán)責(zé),避免誤操作,從圖版處理到一校、二校,再到最后的質(zhì)檢存儲,文溯閣《四庫全書》數(shù)據(jù)處理是條“單行道”。電腦之間不能互相訪問,數(shù)據(jù)傳給下一流程后,前一流程的人員將無權(quán)再改。“在數(shù)據(jù)處理程序軟件和制度流程上,我們有一套完整設(shè)計(jì),確保數(shù)據(jù)資源安全。”宋學(xué)娟輸入賬號、密碼,登錄數(shù)字化成果管理系統(tǒng),所有成品文件呈現(xiàn)在眼前,函盒編碼、書名、作者、朝代,以及長、寬、高和冊數(shù)等基本信息,都有詳細(xì)記錄。“我們爭取今年內(nèi)基本完成圖版處理工作。”她說。影印出版不少圖書館、藏書機(jī)構(gòu)等正虛位以待,靜待“四閣四庫合璧”文溯閣《四庫全書》影印出版,匯聚了社會各界的期待。西北師范大學(xué)教授趙逵夫全程參與了文溯閣《四庫全書》影印出版工程專家論證會。他說,《四庫全書》現(xiàn)存不同版本在內(nèi)容、冊數(shù)、卷數(shù)上皆有不同,通過數(shù)字化影印出版,方便學(xué)者比對研究,意義重大。蘭州大學(xué)教授汪受寬也持相同觀點(diǎn)。他曾用兩年時(shí)間,帶著學(xué)生對甘肅省圖書館編印的《影印文溯閣四庫全書四種》進(jìn)行整理、標(biāo)點(diǎn)和精細(xì)校勘,并將收錄其中的《易圖說》《長安志圖》《墨法集要》《璇璣圖詩讀法》這4種(每種各1冊)書,跟文淵閣本進(jìn)行對比,發(fā)現(xiàn)兩個(gè)版本的文字、圖片等存在901處差異。“4冊書就有這么多差異,3.6萬多冊會是什么樣?”汪受寬說,“文溯閣《四庫全書》影印出版,將對文化史、史學(xué)史、文獻(xiàn)學(xué)研究等都產(chǎn)生重要影響。”期望值高,現(xiàn)實(shí)問題也不少。一方面,古籍實(shí)現(xiàn)數(shù)字化后,盜印現(xiàn)象難以杜絕。另一方面,超大規(guī)模古籍的影印出版投入巨大,盈利是個(gè)難題。“變古籍為現(xiàn)代書籍,背后是大量的人力、物力、財(cái)力成本。”讀者出版集團(tuán)有限公司所屬甘肅人民出版社社長、總編輯原彥平坦言。防止數(shù)據(jù)泄露,采集區(qū)域設(shè)置嚴(yán)密安保措施。宋學(xué)娟介紹,任何人出入采集區(qū),都須經(jīng)過嚴(yán)格安檢,以防手機(jī)等電子設(shè)備進(jìn)入工作區(qū)域。同時(shí),每個(gè)工作臺均安裝了監(jiān)控設(shè)備,每臺電腦都作了加密設(shè)置。應(yīng)對盈利難題,找準(zhǔn)盈利點(diǎn)是關(guān)鍵。原彥平給記者詳細(xì)分析:古籍影印本主要有仿真本和縮印本。前者好比是“克隆體”,從紙張到字號,從排版到裝幀,與原書幾乎“一模一樣”;后者則是“迷你版”,內(nèi)容不變,但字號變小、頁數(shù)變少,冊數(shù)大幅縮減。“文溯閣《四庫全書》若是出全套仿真影印本,成本過高,市場較小。”原彥平說,文溯閣《四庫全書》多達(dá)3.6萬余冊,數(shù)據(jù)采集、處理、編輯、出版等投入大,且多為手工完成,成本高,發(fā)行對象則主要為圖書館、文化館、高校、研究院所等專業(yè)機(jī)構(gòu)和為數(shù)不多的研究者。2024年1月3日,文溯閣《四庫全書》經(jīng)部影印出版專題工作會議召開,確定了出版方案——縮印、16開本、236冊。“我們將按經(jīng)、史、子、集四部,分期分批推出縮印本。如果全套出齊,預(yù)計(jì)共1500冊。”原彥平說。走進(jìn)甘肅省圖書館的古籍閱覽室,其他三閣《四庫全書》的影印本旁,工作人員已為文溯閣《四庫全書》的影印本騰好了書架。“古籍影印本看似小眾、銷路窄,實(shí)際上,版本好、印刷精美、定價(jià)合適的古籍,自有其發(fā)行空間。”從事出版行業(yè)20多年,宋學(xué)娟對文溯閣《四庫全書》影印本的市場前景頗有信心——版本獨(dú)一份,價(jià)值突出,公眾期待較高;自帶流量和話題,營銷成本較低,做到客戶明確、精準(zhǔn)供給,就能減輕銷售壓力。今年初,宋學(xué)娟帶領(lǐng)團(tuán)隊(duì)參加2024北京圖書訂貨會。文溯閣《四庫全書》全套影印出版工作頗受關(guān)注,不僅有高校、圖書館、文博機(jī)構(gòu)的負(fù)責(zé)人,還有銷售商和個(gè)人前來咨詢。“據(jù)市場調(diào)研,不少圖書館、藏書機(jī)構(gòu)等正虛位以待,靜待‘四閣四庫合璧’。”宋學(xué)娟說。“在做好保護(hù)工作基礎(chǔ)上,我們將深入挖掘文溯閣《四庫全書》價(jià)值,努力在信息服務(wù)、文化創(chuàng)意、文旅融合上求突破,讓這座資源寶庫在新時(shí)代活起來、用起來。”讀者出版集團(tuán)有限公司黨委書記、董事長梁朝陽表示?;罨檬淄凭x本,開發(fā)文創(chuàng)產(chǎn)品,讓更多人領(lǐng)略古籍魅力“宣傳推廣古籍的文創(chuàng)產(chǎn)品,既要開發(fā)周邊,更要聚焦古籍本身。”甘肅省圖書館館長肖學(xué)智說,不妨跳出杯子、本子、袋子等樣式,回歸古籍做文創(chuàng),出版精選本圖書。汪受寬介紹,《四庫全書》歷來有“典籍總匯,文化淵藪”之譽(yù),不僅囊括了從先秦至清代乾隆中期之前中國歷史上的主要典籍,而且涵蓋了中國傳統(tǒng)學(xué)術(shù)文化的各個(gè)學(xué)科門類和各個(gè)專門領(lǐng)域。“卷帙浩繁通常也意味著無從讀起,從這個(gè)意義上講,讓‘高冷’的古籍變暢銷的書籍,就是好文創(chuàng)。”肖學(xué)智說。啟函盒、取夾板、解束帶,《文溯閣四庫全書影印精選》露出真容。翻開書頁,映入眼簾的楷書溫潤大方、賞心悅目。每頁8行、每行21字,雖是手抄,可字的大小、間距幾無差異,工整如打印一般。“共計(jì)40卷,分為3函、5種、18冊。”肖學(xué)智介紹,為突出甘肅文化特色,這套影印精選本甄選了文溯閣《四庫全書》子部所收古代隴人著作兩種——《潛夫論》和《拾遺記》,另外還有《文房四譜》《法書要錄》《畫史會要》等書畫藝術(shù)史經(jīng)典作品3種。這樣一套精裝古籍,俘獲了不少讀者的心。“自去年5月出版發(fā)行,迄今已銷售680多套,平均每天銷售約2套,這在古籍中銷量不低。”甘肅省圖書館文創(chuàng)中心負(fù)責(zé)人介紹,甘肅省圖書館10多年前就曾出版《影印文溯閣四庫全書四種》,暢銷至今,共售出5600多套。“優(yōu)質(zhì)的古籍,就是優(yōu)質(zhì)的文創(chuàng)。”肖學(xué)智說,近年來,甘肅省圖書館以文溯閣《四庫全書》為素材,從其包裝方式、撰寫格式、用色寓意、人文理念等角度汲取靈感,推出了一系列文創(chuàng)產(chǎn)品,“目前,我們正挖掘文溯閣《四庫全書》中的龍?jiān)?,即將推出特色伴手禮。”“古籍活化,不能止于開發(fā)文創(chuàng)產(chǎn)品。”肖學(xué)智說,為了讓更多人樂于走近文溯閣《四庫全書》,領(lǐng)略古籍魅力,甘肅省圖書館打造了多個(gè)文創(chuàng)場景——線上,推出“文溯·隴跡”等專欄,在“云”上賦予古籍新話題;線下,建成甘肅省圖書館文溯閣《四庫全書》藏書館展廳,讓參觀者沉浸式體驗(yàn)纂修、流傳、保護(hù)、發(fā)展等歷史場景,與“書”同行……“我們舉辦的‘千古巨制——《四庫全書》展’是國內(nèi)較早推出的《四庫全書》專題展覽,至今已在全省50多個(gè)圖書館流動展出。”肖學(xué)智介紹,今年3月,省圖書館還啟動了專題展覽進(jìn)校園活動,未來還將推動展覽進(jìn)社區(qū)。年輕讀者馬瑛正是通過這個(gè)展覽認(rèn)識了文溯閣《四庫全書》,并買了一套《影印文溯閣四庫全書四種》。“帶回去,讓更多人了解我們的典籍瑰寶。”馬瑛說。今年,甘肅省出臺《關(guān)于以“八個(gè)一”文化品牌為抓手全力推動文化傳承發(fā)展的實(shí)施方案》,其中一個(gè)“一”即為“一部《四庫全書》,讓中國古典文化活起來”。實(shí)施方案提出,加強(qiáng)文溯閣《四庫全書》保護(hù)傳承、整理研究、數(shù)字轉(zhuǎn)化、版權(quán)開發(fā)、活化利用等,激發(fā)古籍保護(hù)利用活力。“影印出版,是活化利用的第一步。”肖學(xué)智說,未來還將建設(shè)完整、好用的數(shù)據(jù)庫,研發(fā)音視頻等產(chǎn)品,讓文溯閣《四庫全書》的“數(shù)字分身”走進(jìn)千家萬戶。
來源 | 人民日報(bào)客戶端