網站導覽關於本館諮詢委員會聯絡我們書目提供版權聲明引用本站捐款贊助回首頁
書目佛學著者站內
檢索系統全文專區數位佛典語言教學相關連結
 


加值服務
書目管理
書目匯出
佛學書目自動化標記與後分類應用研究=Automated Tagging and Post-Classification Analysis of Bibliographies of Buddhist Studies
作者 蔡鴻謨 (著)=Tsai, Hong-mo (au.)
出版日期2022.07
頁次44
出版者國立臺灣大學
出版者網址 https://www.ntu.edu.tw/
出版地臺北市, 臺灣 [Taipei shih, Taiwan]
資料類型博碩士論文=Thesis and Dissertation
使用語言中文=Chinese
學位類別碩士
校院名稱國立臺灣大學
系所名稱電機資訊學院資訊工程研究所
指導教授項潔
畢業年度111
關鍵詞臺大佛學數位圖書館=NTU Digital Library of Buddhist Studies; 字串比對=string matching; 後分類=post-classification; 停用詞=stopwords; 標記=tagging
摘要臺大佛學數位圖書館(NTU Digital Library of Buddhist Studies)收錄了大量的佛學書目資料,並且擁有完善的檢索系統,提供研究人員做佛學資料的搜集。基於書目metadata的欄位,臺大佛學數位圖書館的書目檢索系統對檢索結果提供了6種後分類:出版年份、資料類型、出處題名、關鍵詞、著者、語言,這些後分類都是書目匯入時既有的metadata欄位,若是能為書目做佛學類別專門詞彙的標記,並且將標記做為後分類提供給使用者,將更有利於研究人員對於書目資料的篩選及整理。
本研究旨在於為臺大佛學數位圖書館的書目資料進行標記,新增三個標記類別:佛教宗派、佛教人物、佛教經典。事先收集這些類別的專門詞彙進行字串比對實現自動標記,並建立停用詞表,以利為字串比對的專門詞彙進行篩選,搭配人工輔助檢核標記,專門詞彙、停用詞表以進行更新,並為臺大佛學數位圖書館的書目檢索系統新增三種不同的後分類:「提及:佛教宗派」、「提及:佛教人物」、「提及:佛教經典」,隨著專門詞彙及停用詞表的完整,期待能夠帶給使用者較為準確的標記及後分類,為使用者帶來更佳的使用體驗。

NTU Digital Library of Buddhist Studies has a large collection of bibliographies of Buddhist studies and a comprehensive bibliographic search system for researchers to access Buddhist materials. Based on bibliographic metadata, the bibliographic search system of NTU Digital Library of Buddhist Studies provides six types of post-categories of query results: publication years, media types, source topics, keywords, authors, and languages. If the bibliographies can be tagged with specific vocabularies of new categories, the categories and taggings can also be used for additional post-query classification. This will provide more beneficial for researchers to filter and organize the bibliographic data.
The purpose of this study is to tag the bibliographic data of NTU Digital Library of Buddhist Studies by add three new tag categories: Buddhist sects, Buddhist persons, and Sutras. The terms of each categories are collected in advance for string matching to obtain automatic tagging. A list of stopwords is also created to facilitate the filtering of specific words for string matching and correction of tags. The lists of vocabulary and stopwords can be modified manually. We added three different categories to the bibliographic search system of NTU Digital Library of Buddhist Studies. They are ”Mentions: Buddhist Sect”, “Mentions: Buddhist Persons”, and “Mentions: Sutra”, each with a specialized vocabulary and a list of stopwords. Through post-query classification using these categories, we hope to provide better user experience.
目次第一章 緒論 1
1.1研究背景與動機 1
1.2研究目的與問題 1
1.3論文架構 2

第二章 現況探討與相關文獻 3
2.1臺大佛學數位圖書館 3
2.2專門詞彙資料收集參考 5
2.2.1《佛學圖書分類法(2011年版)》 5
2.2.2DILA人名規範資料庫 5
2.2.3CBETA中華電子佛典協會 6
2.3標記工具參考 7
2.3.1Markus半自動標記平台 7
2.4本章小結 8

第三章 研究方法 9
3.1研究對象與範圍 9
3.2研究流程與方法 9

第四章 功能設計與實作 14
4.1架構設計 14
4.2資料處理 15
4.2.1書目資料表欄位新增 15
4.2.2停用詞資料表 18
4.2.3佛教宗派專門詞彙 18
4.2.4佛教人物專門詞彙 20
4.2.5佛教經典專門詞彙 24
4.2.6資料處理實作 25
4.2.7小結 27
4.3自動標記實作 29

第五章 UI功能設計與範例演示 32
5.1輔助人工檢核範例演示 32
5.2書目後分類及標記呈現 37
5.3本章回顧 41

第六章 結論與未來工作 42
6.1研究結論 42
6.2未來工作 43

參考文獻 44
DOI10.6342/NTU202202547
點閱次數394
建檔日期2022.09.20
更新日期2023.01.16










建議您使用 Chrome, Firefox, Safari(Mac) 瀏覽器能獲得較好的檢索效果,IE不支援本檢索系統。

提示訊息

您即將離開本網站,連結到,此資料庫或電子期刊所提供之全文資源,當遇有網域限制或需付費下載情形時,將可能無法呈現。

修正書目錯誤

請直接於下方表格內刪改修正,填寫完正確資訊後,點擊下方送出鍵即可。
(您的指正將交管理者處理並儘快更正)

序號
649295

查詢歷史
檢索欄位代碼說明
檢索策略瀏覽