佛學數位圖書館暨博物館 -- 台大與中華佛研所共同開啟新的里程碑
杜正民
佛學研究中心學報
第五期(2000.07)
頁341-351
頁341
提要
原台大哲學系釋恆清教授自1994年創辦的「佛學網路資料庫」,於1999年底經台大校長陳維昭教授與法鼓山中華佛學研究所創辦人聖嚴法師簽訂合作條約,並更名為「佛學數位圖書館暨博物館」(http://ccbs.ntu.edu.tw) 擴大經營。位於台大舊總圖二樓的新辦公室也於2000年5月6日正式啟用,值此歡欣之際特將本計畫目前正在進行與擬進行的項目做一簡介。
同時,將擬採用的各項作業標準與方法提出就教於諸先進,期能獲得學者專家的指導,以建構一適合當代需求的佛學專業網站,提供專業的服務。進而,設計以個人網頁為導向的功能,提供讀者個人佛學網路書房。
頁342
壹、緣起
2000年5月6日上午十時,「佛學數位圖書館暨博物館」假台灣大學國家科學委員會人文學研究中心會議室,舉行開幕茶會。與會貴賓雲集,包括台大校長陳維昭、教務長李嗣涔、文學院佛學研究中心主任林義正、人文學研究中心主任林正弘、法鼓大學校長曾濟群、中華佛學研究所所長李志夫等人都到場祝福。
這個象徵現代化佛學資料庫統整的「數位圖書館暨博物館」,是由台灣大學與法鼓山中華佛學研究所共同經營的科技佛學網站。這項合作案是在1999年10月由國立台灣大學校長陳維昭教授,與法鼓山中華佛學研究所創辦人聖嚴法師正式締約後底定,將原來台大佛學研究中心的「佛學網路資料庫」,擴大並更名為「佛學數位圖書館暨博物館」(http://ccbs.ntu.edu.tw),由雙方共同合作經營。
雙方合作方式乃由中華佛學研究所網資室負責資料蒐集、組織、數位化與經營等所需的人員與經費;台大則提供研究室、主機,每年並提撥部分經費支援。原台大佛學中心之獅子吼BBS站 (cbs.ntu.edu.tw) 除保留原名外,並轉移至研究室內, (註1) 委由中華佛學研究所維護管理。
註1:該研究室目前設置於台灣大學舊總圖書館二樓216室。
頁343
促成雙方合作因緣,也是原「佛學網路資料庫」創辦人台大哲學系教授恆清法師對於此項計畫能順利開展,表達了他深切的感恩與歡喜。而共同推動此項合作計畫的台大哲學系林正弘教授、資工系許清琦主任、歐陽彥正教授,以及中華佛學研究所主管、佛學網路資訊室同仁等,也都以最大的喜悅迎接這個充滿未來性與前瞻性的計畫。
自1994年成立至今的「佛學網路資料庫」,目前已完成書目資料約九萬筆、佛學全文資料千餘筆、各種佛學教學項目及多種網頁資料庫。 (註2) 未來「佛學數位圖書館暨博物館」除奠基於原有的豐沛資源外,更將整合台灣大學與法鼓山中華佛學研究所雙方的豐厚資源與專長,期使台灣的佛學網路資料庫進入新的里程,不但豐富原有資料庫內涵,並將持續推出整合性佛教專業入門網站,以提供更專業的服務,讓華人世界的這項成就提供給全世界寬廣的用途,也讓佛法能在科技時代永續發展。 (註3)
貳、「佛學數位圖書館暨博物館」目前及擬進行的工作項目
由於網際網路的發達,上網查詢資料已經成為現代人搜尋資料的重要管道。自從佛典電子化逐漸為佛教界重視後,不單是浩瀚的佛教典籍,連相關的資訊也都愈趨豐富,並逐漸普遍化,而為學佛與佛學研究者所重視。
長期以來,作為佛學研究機構中步伐前進極快、資料建構相當完備的中華佛學研究所,也未在這一波資訊浪潮中缺席,反而因「佛學數位圖書館暨博物館」的成立,而積極地扮演起幕後支援的力量。
這股力量不只在「佛學數位圖書館暨博物館」中研發,更不斷將成果透過網路上的相關網站傳送到網友身邊,達到最紮實的後方補給功能。
謹此向讀者們介紹目前「佛學數位圖書館暨博物館」的進度與未來的計畫,而最重要的,則是提供讀者們分享這些成果的捷徑。
一、大正藏電子化作業的持續進行
中華電子佛典協會的大正藏的電子化作業,向來是「佛學數位圖書館暨
註2:有關「佛學網路資炓庫」前期製作流程與內容請參考:杜正民,〈「佛學網路資料庫」的建構過程與內容簡介〉,《國立臺灣大學哲學論評》第23期,2000年1月,頁331-335。該文對於1994年至1999年間該資料庫的建構與內涵有詳盡的描述。
註3:本則消息曾登載於《臺大校訊》第580號,2000年5月31日及《人生雜誌》第202期,2000年5月,頁113。
頁344
博物館」支援的重要工作,而其努力的成果也已受到國際間高度的肯定與支持。 (註4)
目前進行中的作業,主要是將《大正新脩大藏經》中的前五十五冊及第八十五冊的藏經內容,先行輸入電子檔及做必要的標記(Markup),並將預計達一億多字的內容,做成完整的電子版佛典。與一般電子佛典相較,其最大的特色,是附有全文檢索及多版本比對的檢索等功能。
至今,已經有印度撰述部計三十二冊(含密教部十八冊至二十一冊)的藏經置於網站上,可逕行登上中華電子佛典協會(Chinese Buddhist Electronic Text Association, CBETA)網站(網址:http://ccbs.ntu.edu.tw/cbeta)閱覽及查詢。
二、佛教當代研究文獻全文資料庫
在學術研究工作中,想要蒐集完整的資料既重要又辛苦。而「佛學數位圖書館暨博物館」在這個部分也提供了他們的專長,目前持續進行中的資料,收錄有現代中文佛學學術論文,及英文佛學論文。
其中英文佛學論文方面,有些甚至是五十年以上的經典作品,此外,最精彩的部分,則是蒐集到許多已經絕版了的寶貴資料!這項收錄的成果,在國際間也頗受肯定。
論文蒐集完成後,將會直接登錄於「全文資料庫」中,以方便查詢者檢索使用。此外還將建立完整專業的「當代國際佛學圖書書目」,並配合全文檢索的功能,這些資料也都會登錄在網路上,提供國內外學術界自由使用與下載,全文資料庫目前已有中英文學術論文一千篇左右。
三、佛學學報全文數位資料庫建置
目前已完成國內多項佛學研究學報的全文登錄,如:《中華佛學學報》、《華岡佛學學報》、《中華佛學研究》、《台大哲學論評》、《台大佛學研究中心學報》、《東方宗教研究》等。此外也已將取得國外授權的Philosophy East and
註4:有關佛典電子化文獻請參考:杜正民,〈漢文電子大藏經的製作緣起與作業流程:『中華電子佛典協會』簡介〉,《佛學研究中心學報》4期,1999年7月,頁347-369。杜正民,〈以CBETA為例談大量文獻之建立 -- 漢文藏經電子化作業簡說〉,《中央研究院計算中心通訊》第15卷第13期,1999年6月,頁117-123。以及杜正民,〈中華電子佛典協會1999年度成果發表會 -- 《大正藏》印度撰述部經、律、論電子佛典發行〉,《現代佛教學會會訊》第五期,2000年1月,頁10-13。上述諸文對台灣當今電子佛典的發展做整體性的介紹。
頁345
West等學術專刊的全文建檔。
四、佛學書目資料庫
不斷充實的「佛學書目資料庫」中蒐集的書目,目前已高達九萬多筆,可算是全球最完備的佛學專業資料庫。
本資料庫所收集與整理的書目資料,包括中、英、日文和歐洲語系等多種書目資料,同時不斷更新內容,以增加新的書目資料,提供使用者最新及最完備的資訊。另外,本資料庫與其他圖書館最大的差異,在於查詢的結果可提供除附有提要外,並可連結至已經完成的全文文章。
五、台灣佛教文獻數位化資料庫
為提昇台灣佛教研究的學術水準,並希望將研究成果推展於國際間,本土文化的研究相當重要,因此目前與臺大哲學系楊惠南教授合作,開始逐步建構「台灣佛教文獻數位化資料庫」。
其中將蒐集自明末鄭成功到清初時期的台灣佛教資料,並加入日據時代相關資料的整理、編輯與翻譯,同時彙編當代佛教文獻。而待第一階段資料蒐集完整後,即進行文獻的整理與研究,並將完整的資料與研究成果,登錄網站供國內外學術界參考、運用,相信未來這個資料庫會是研究台灣佛教界不可或缺的重要網站。
六、佛學教學課程的研究與建置
中華佛學研究所開設有許多極具特色的課程,也為學生準備有相當豐富的資料庫,現在這些都正朝電子化運作,而將建立所謂的「網路教學課程」,並搭配以「佛教思想教學資料庫」。目前預計建置的資料庫有「印度佛教思想史」、「中國佛教發展史」及「阿含學」等專題或專書研究的資料庫。
七、佛學專題研究資料庫的建置
許多佛學研究的專題,如佛學索引典、佛教圖像、石窟文獻,都是極具研究價值的主題,也有足夠豐富的資料可供未來研究者參考,因此未來也將針對這些專題,逐步建立個別的研究成果。
另外並以翻譯TEI(Text Encoding Interchange)手冊為其中一項重要工作,TEI 是針對電子文獻所制定的標準標記組(tag set),透過國際標準
頁346
標記的運用,如此可讓 CBETA製作的電子佛典更便於國際間分享。
索引典的專題研究目前進行中的有《華嚴部》及《瑜伽師地論》,以為佛學索引典的範本。
八、佛學數位博物館
除佛教文獻的數位化,佛教文物的數位化也是很重要的部份。因此,立基於多年的佛學數位化經驗,目前除加強佛學數位圖書館的建構外,也開始佛學數位博物館的建立。初步先參加「國科會數位博物館計畫」執行「玄奘西域行—數位博物館」的計畫,期能於短期內完成佛學數位博物館的雛型與基本建構工作。
九、其他
短期內「佛學數位圖書館暨博物館」並擬進行「佛教電子辭典」的建置,同時嘗試各樣的佛學應用工具,以利佛學研究電子化的運用。 (註5)
參、作業方式與方法
「佛學數位圖書館暨博物館」將依上述的佛學文獻電子化標的及佛學文物數位化的期許,以之作為初期各項計畫(以下簡稱本計畫)的進行目標。中華佛學研究所除繼續支援佛典大量資料庫、佛典全文資料庫與佛學書目資料庫的建立外,並擬訂定佛典標記功能表 (Markup)、規劃XML (Extensive Markup Language) 作為標記工具、修編適合電子佛典製作的國際編碼交換協定(Text Encoding Interchange, TEI)、連結佛典資訊超文件 (Hyper-text)、佛典知識架構的建立 (科文的應用)、設計人性化檢索引擎 (Search Engine)、編撰佛學索引典 (Thesaurus)、重構佛典的時空架構 (GIS)及漢文電腦缺字 (Rare Characters) 處理等作業。並將針對標記建立文獻架構 (Structure)、佛典科文作大綱結構 (Outline) 、佛典索引典 (Thesaurus) 作為基本概念 (Concept) 的建置。以提供華文古籍研究的各項需求與技術,如古德的論疏、今人的著作、字辭典類書等、語文比對版本比對。亦即電子佛典所需資訊可大分為
註5:本段改編自筆者相關諸文,如《人生雜誌》第197期,2000年1月,頁119-121。
頁347
1.佛典版本資訊、2.佛典譯本資訊、3.佛典校勘資訊、4.佛典論疏資訊、
5.佛典語文資訊、6.佛學參考資訊、7.技術問題
一、茲就此七項分列如下:
1.
佛典版本資訊:
不同版本的比對與參照、瀏覽各版本資料的異同、
建立各版本的沿革資料、重現建原始版本的原貌。
2.
佛典譯本資訊:
翻譯者、翻譯年代、原文版本、各種譯本、譯本比對。
3. 佛典校勘資訊:
勘誤、各版本的差異、各家校勘。
4. 佛典論疏資訊
佛典與相關註疏的超連結、註疏的檢索與呈現、
各家註疏的比對、科文架構。
5.
佛典語文資訊:
佛典語文:漢文、梵文、藏文、巴利文、其他語文。
6.
佛學參考資訊:
建立當代佛學書目/文獻資料庫、連結佛典資料與當代書目/文獻、
佛典與書目/文獻的檢索與參照、佛典電子化的困難及解決方案。
7.
技術問題:
跨國語文環境與不同平台的問題 (如何將漢文資料呈現於不同平台)、
缺字問題 (如造字、管理、呈現、檢索等)、
格式統一 (不重複工作避免資源浪費與降低成本等)、
建立電子佛典交換標準 (交換碼與格式等)、
如何達成資源共享。
頁348
為解決上述問題與困難,本計畫擬結合相關的學者專家共同解決困難與問題,配合上述需求開始各項技術性的研發。
二、擬採用之標準與方法
為建構多媒體形式的知識結構之典藏主題,以建立完善的交換標準。本計畫擬依下列標準建構「知識基本表達」,如計算機的資料結構、知識屬性整理、內容的外化 (形式化) 知識結構之準則等:
1. 文物資料擬依Metadata 標準,建立專業領域之共同後設資料:
有關文物圖像的表達,則以專業領域共同之後設資料 (Metadata) 作為標準。參照「數位博物館資源組織與檢索相關規範工作小組」(Ross 小組) 所規範之MICI 都柏林核心集 (Dublin Core,http://purl.org/DC) 之中文全市資料交換格式 (http://ross.lis.ntu.edu.tw/document/metadata/)。並參照國外CIMI (the Consortium for the Computer Interchange of Museum Information, http://www.cimi.org/documents/meta_bestprac_v031.html) 的各項標準。
此外,中華佛學研究所於1999年於中研院協辦的EBTI (Electronic Buddhist Text Initiative) 國際電子佛典推進會議中,曾與多位以Metadata 為標準的工作單位聯繫,如與澳洲Dr. Helen Jarvis和Dr. Ian Johnson商洽有關佛教文物Metadata 的規則與實務,及應用軟體 (Metadata Editor and Search) 的取得與應用等。
擬採取的Dublin Core標準,是以其十五個元素記錄所有電子化資料的屬性,作為先製資料。以利作業人員或使用者用些項目來管理電子圖書館與電子博物館的文獻資料及文物項目,並將參照Z39.50作為檢索與交換的標準。
同時,Metadata 於佛學文獻資料的電子化是一重要的概念,尤其在佛學書目的管理,以及佛教文物圖像的電子化,皆可採用Dublin Core 的十五個元素作為標準建立先製資料,以做檢索與交換之準則。國外的Consortium for the Computer Interchange of Museum Information (CIMI) 及台灣大學的「數位博物館詮釋資料」(MICI) 都有相當的實務與應用軟體
頁349
可茲運用,因此對本計畫的進行,必有相當的助益。
2. 圖像資料庫 (Image Database) 管理,擬依有專業經驗的Huntington Archive標準:
本計畫與美國Ohio State University從事佛教圖像資料庫Huntington Archive (http://kaladarshan.arts.ohio-state.edu/) 的Dr. Huntington夫婦及Dr. Janice Glowski有相當的聯繫;他們蒐集相當豐富的佛教圖像,是一龐大的佛教圖像資料庫。因此,本計畫可藉多年來與他們的工作經驗,以確立本計畫目標與任務的方式進行,譬如依國際標準、所需設備、應用軟體等需求,建立協定 (Establishing Protocols)、 攝影協定 (Photography Protocols)、數位化協定 (Digitization Protocols) 等方式,進行建立電腦之間通信與資料傳送所遵守的規則,以達成圖像影像檔的方便交換與管理之目的。
因此,本計畫將採取Huntington Archive of Buddhist and Related Art 佛教圖像資料庫的實務經驗,如影像校正 (Image Correction) 的實際經驗,考慮採用具有自動功能的高速掃描器,以掃描器的最高解析度掃描等實際的工作情形,以提高品質。加上,他們所提供的工作上常犯錯誤與改進方法等實際經驗,當可作為本計畫的最佳務實參照。
總之,要建立一佛教圖像資料庫,Ohio State University的Dr. Huntington的作法及其所提供的經驗與建議,是相當有用的資訊。
3. 有關時空的表現,擬以地理資訊系統 (GIS, Geographical Information System) 為作業標準:
由於本計畫含有時空的表達與建構,因此擬以「文化地圖協會」 ( Electronic Cultural Atlas Initiative, ECAI) 的規範作為參考,該組織有多個東方研究資料,如中國、絲路、佛學的計畫等,可作為實務參考與諮詢。其中,澳洲 Metadata Clearinghouse 的「時空地圖計畫」 ( Time Map Project, http://www.timemap.net) 即是一很好的實例,並且其已開發出編輯與檢索軟體 (Metadata Editor and Search) 可實際應用。是以,本計畫擬以其已進行的資料管理、登錄、編輯、匯入或匯出新的項目等作業方式,及其新開發的視窗型編輯器、檢索系統等應用工具作為實務運用,這些工具對本計畫的完成將會有相當的助益。
澳洲Dr. Lawrence Crissman 的「中國文化地圖資料」 (GIS and Coding/
頁350
Marking-up ECAI China Atlas Materials) 及美國Dr. Karl Longstreh 主持的芝加哥大學中國研究所「中國資料中心」(China Data Center, http://www.umich.edu/~iinet/chinadata) 等,都是運用GIS建立資料結構與地圖的對應工作經驗。以其實務經驗運用GIS 的技術、建立與應用GIS 的程序、以GIS 作為研究及組織資源與資訊的方法等,對本計畫GIS 的實際運用將有進一步的的作用。譬如,對於如何將之運用於同一地理位置的歷史變遷,或以歷史地理資訊架構一個多層次超越時空的資訊資料,皆可以很方便與明確的顯示出來。就GIS 的時間、空間參照,與GIS專有的作業為基礎,相信GIS的使用與發展,對本計畫的資訊研發將有很大的影響。
因此,GIS系統在佛學研究及應用上,將會有很大的助益。因為,不但可以建立歷年來的佛教史料與地理資料外,更可以連結本計畫主持的中華電子佛典協會處理過的標誌(Markup) 經文,以建立各種完整的佛教時空狀況,作為進一步的研究。譬如唐代各寺院史料的研究,佛教歷史地理的發展,當代高僧大德的研究等等,都可以用時間與空間加上語言文獻的研究,重新建立一新的架構作為研究資料。
4. 全文資料庫擬依《電子文獻文獻編碼與交換導覽》(TEI P3/P4) 作為標準:
本計畫文獻全文擬依Michael Sperberg-McQueen (Univ. of Illinois, Chicago) and Lou Burnard (Oxford University)所著的《電子文獻文獻編碼與交換導覽》 Guidelines for Electronic Text Encoding and Interchange (TEI P3/P4) 為標準。 (註6) 此書除TEI標準外,並含TEI Document Type Definition (DTD)。(有關TEI資料可參考網頁資料 http://www.uic.edu/orgs/tei, 或 http://etext.virginia.edu/TEI.html)
本計畫於進行《大正新脩大藏經》電子化作業時,即已聘請德國哥廷根大學 Christian Wittern 博士參與中文TEI 標準的工作,並積極參與TEI 發起單位 the Association of Computing in the Humanities (ACH),the Association for Computational Linguistics (ACL) 及the Association for
註6:Sperberg-McQueen, C. Michael and Burnard, Lou (Eds.) Guidelines for Electronic Text Encoding and Interchange [TEI P3], Chicago and Oxford: Text Encoding Initiative, 1994.
頁351
Literary and Linguistic Computing (ALLC) 所舉辦的會議;並與TEI一書作者Dr. Lou Burnard 及Sperberg-McQueen 商討有關東方文獻建立TEI標準的問題等,以確認及增進文獻編碼交換的可能。上述經驗,將可輕易轉換為本計畫工作實務。
5. 全文的建置內容,為能達國際交換的標準,擬以SGML/XML作為標誌語言:
至於內容外化的部份,則擬採用符合國際標準的SGML/XML標誌語言 (請參照 http://www.w3c.org ),做為機器解讀與形式表達之用,不但可以作為國際交換標準,並且還可以作外化內容之間的聯繫關係,進而構成一知識結構體。本項作業,除了上述Christian Wittern博士的參與外,並擬邀約目前工作於中央研究院計算中心的Rick Jelliffee (XML Cookbook 一書的作者) 指導有關事務。事實上,從Jelliffee 先生1998年來台開始,我們雙方即有相當的接觸與交流。
本計畫擬採用上述標準以建構「知識基本表達」,達國際交流,資源交換的標準為目的。 (註7)
簡言之,本計畫最重要的是工作目標,就是完成上述各項計畫,建構完整的佛學數位圖書館與數位博物館的資料。期能建構一適合當代需求的佛學專業網站,提供專業的服務。進而,針對使用者的習性,設計以個人網頁為導向的功能,提供讀者個人佛學網路書房。
註7:有關國際間佛典電子化發展狀況與標準, 請參閱杜正民,〈當代國際佛典電子化現況:電子佛典推進協議會 (EBTI) 簡介〉,《佛教圖書館館訊》15期,1998年9月,頁28-39。杜正民〈從台北看國際電子佛典實況:1999 EBTI 會議實錄〉,《現代佛教學會會訊》第二期,1999年4月,頁10-17。以及杜正民,〈電子佛典發展概況〉,《中央研究院計算中心通訊》第15卷第13期,1999年6月,頁114-116。或網頁資料http://ccbs.ntu.edu.tw/EBTI。