首頁>收藏·鑒寶>資訊資訊
數(shù)字善本亟待抱團取暖
十幾年前,電子版《文淵閣四庫全書》《四部叢刊》等古籍?dāng)?shù)據(jù)庫問世,極大提升了古代文獻的檢索效率,給文史研究帶來了便利。近來,在北京大學(xué)、中國人民大學(xué)等大學(xué)圖書館的網(wǎng)站上,陸續(xù)出現(xiàn)了“中華經(jīng)典古籍庫”的身影,其所收入的600多種、4億字古籍全部經(jīng)過點校整理、正版授權(quán),文史研究的學(xué)術(shù)生態(tài)因此又一次改變。隨著中華書局、巴蜀書社、鳳凰出版社、天津古籍出版社等古籍社相繼加盟該數(shù)據(jù)庫建設(shè),國內(nèi)古籍出版的業(yè)態(tài)也悄然發(fā)生著變化。
上海圖書館庫房 資料圖片
讀者在進行古籍?dāng)?shù)字產(chǎn)品體驗。資料圖片
呼喚數(shù)字善本
從前,說起古籍?dāng)?shù)據(jù)庫,學(xué)者總有些“放心不下”。學(xué)者只承認古籍?dāng)?shù)據(jù)庫是獲取文獻的重要輔助工具,但在論文、著作中征引文獻時,仍要使用點校本紙書,而絕少使用古籍?dāng)?shù)據(jù)庫的文本。如果有哪位學(xué)者大量征引古籍?dāng)?shù)據(jù)庫的文本,通常會被視為“不專業(yè)”。
“數(shù)字古籍產(chǎn)生問題的原因眾多,數(shù)字文獻選擇底本的不善,某些開發(fā)商因規(guī)避版權(quán)等原因,錄入文本與宣稱版本往往名不符實。數(shù)字文獻制作中因字形差異,校核不精等所產(chǎn)生錯字、缺字眾多,甚至錯行錯頁、脫行脫頁之例也屢見不鮮。”中國社會科學(xué)院歷史研究所研究員陳爽曾在一篇文章中指出,時下學(xué)者對數(shù)字古籍的質(zhì)量要求遠不及印刷文本,將檢索而來的史料覆按原書,成為論文付梓前一道必不可少的工序。
根據(jù)陳爽的經(jīng)驗,即使是文本錄入準(zhǔn)確率很高的臺灣“漢籍資料庫”,也存在一些瑕疵。比如,在這個數(shù)據(jù)庫中,《太平御覽》等古籍中所有“鹽”“劍”的異體字都被當(dāng)作無法顯示、檢索的生僻字,做成了圖片格式,看似忠實原書,實際上造成了檢索的困難。陳爽說:“這對于古代經(jīng)濟史料和軍事史料的搜集將是災(zāi)難性的。”
在文史學(xué)界,像陳爽一樣對各種古籍?dāng)?shù)據(jù)庫的優(yōu)勢、劣勢了然于胸的畢竟是少數(shù),而且這些經(jīng)驗需要花費大量時間不斷積累。這使得本應(yīng)成為學(xué)術(shù)研究“利器”的古籍?dāng)?shù)據(jù)庫,無法發(fā)揮出其應(yīng)有的作用。有學(xué)者提出了“數(shù)字善本”的概念,希望古籍?dāng)?shù)據(jù)庫從過去的貪大、貪全,轉(zhuǎn)變?yōu)榍缶⑶鬁?zhǔn)。
在“中華經(jīng)典古籍庫”的出版方、古聯(lián)(北京)數(shù)字傳媒科技有限公司總經(jīng)理顧青看來,在“數(shù)字善本”求精、求準(zhǔn)的基礎(chǔ)上,還應(yīng)該充分體現(xiàn)當(dāng)代古籍整理的成果。他認為,以往的古籍?dāng)?shù)據(jù)庫主要是將古籍的文字進行數(shù)字化,方便了檢索,即使文本準(zhǔn)確,這些數(shù)字化了的古籍沒有標(biāo)點,而且保留著古書在流傳中出現(xiàn)的種種錯誤,不適合一般讀者使用,專業(yè)學(xué)者也沒辦法引用,將當(dāng)代學(xué)者整理的點校本古籍進行數(shù)字化,是未來古籍?dāng)?shù)字化發(fā)展的大趨勢。但當(dāng)代古籍整理的點校本涉及復(fù)雜的版權(quán)歸屬以及學(xué)術(shù)質(zhì)量評價等問題,做起來并不容易。
顧青介紹,雖然困難不少,但“中華經(jīng)典古籍庫”所收圖書均為整理本古籍,包含二十四史、新編諸子集成、清人十三經(jīng)注疏、史料筆記叢刊、古典文學(xué)基本叢書等,今后還將不斷增加文獻數(shù)據(jù)量,將全國各大古籍出版社的優(yōu)秀整理本進行數(shù)字化。
古籍出版,也需融合發(fā)展
據(jù)統(tǒng)計,新中國成立以來已整理出版2萬多種古籍,其中版權(quán)清晰、整理質(zhì)量較高的5000種,體量達50億字。然而,這些點校本的版權(quán)分散在全國幾十家古籍出版社和眾多大學(xué)出版社、社科出版社,如果各出版社單打獨斗,就會出現(xiàn)數(shù)十個小型古籍?dāng)?shù)據(jù)庫,難以形成規(guī)模優(yōu)勢。如果“抱團取暖”,把這些古籍整理成果集納到一起,海量經(jīng)過整理、篩選的“數(shù)字善本”,將成為文史研究的重要文獻資源。
“在傳統(tǒng)出版年代,各古籍出版社圍繞國家規(guī)劃,團結(jié)合作,平等互利,我們特別希望,在數(shù)字出版階段大家也能形成這樣一種合力,否則我們的資源優(yōu)勢會逐步喪失。”中華書局總經(jīng)理徐俊認為,對于古籍整理出版這樣的專業(yè)出版形態(tài),資源的橫向聚合十分重要。
目前,除了中華書局、巴蜀書社、鳳凰出版社、華東師大出版社、天津古籍出版社,同屬“全國古籍出版社聯(lián)合會”成員的齊魯書社、遼海出版社也有意加入“中華經(jīng)典古籍庫”。顧青希望,2016年“中華經(jīng)典古籍庫”的數(shù)據(jù)規(guī)模能達10億字。
在服務(wù)大學(xué)、科研院所等機構(gòu)用戶的同時,供個人使用的在線版、手機版“中華經(jīng)典古籍庫”也正在研發(fā)之中,一般的傳統(tǒng)文化愛好者也將有機會使用權(quán)威數(shù)據(jù)庫認識傳統(tǒng)文化。在顧青心中,未來的“中華經(jīng)典古籍庫”不僅僅是一個古籍?dāng)?shù)據(jù)庫,而且是一個學(xué)者可以發(fā)表學(xué)術(shù)觀點、交流學(xué)術(shù)心得,出版社可以進行版權(quán)貿(mào)易的融合出版平臺,這將成為媒體融合時代古籍出版社轉(zhuǎn)型的重要嘗試。(本報記者 杜 羽)
編輯:邢賀揚
關(guān)鍵詞:數(shù)字善本 古籍?dāng)?shù)據(jù)庫 中華經(jīng)典古籍庫 古籍出版