|
|
|
|
|
|
|
|
佛學書目自動化標記與後分類應用研究=Automated Tagging and Post-Classification Analysis of Bibliographies of Buddhist Studies |
|
|
|
Author |
蔡鴻謨 (著)=Tsai, Hong-mo (au.)
|
Date | 2022.07 |
Pages | 44 |
Publisher | 國立臺灣大學 |
Publisher Url |
https://www.ntu.edu.tw/
|
Location | 臺北市, 臺灣 [Taipei shih, Taiwan] |
Content type | 博碩士論文=Thesis and Dissertation |
Language | 中文=Chinese |
Degree | master |
Institution | 國立臺灣大學 |
Department | 電機資訊學院資訊工程研究所 |
Advisor | 項潔 |
Publication year | 111 |
Keyword | 臺大佛學數位圖書館=NTU Digital Library of Buddhist Studies; 字串比對=string matching; 後分類=post-classification; 停用詞=stopwords; 標記=tagging |
Abstract | 臺大佛學數位圖書館(NTU Digital Library of Buddhist Studies)收錄了大量的佛學書目資料,並且擁有完善的檢索系統,提供研究人員做佛學資料的搜集。基於書目metadata的欄位,臺大佛學數位圖書館的書目檢索系統對檢索結果提供了6種後分類:出版年份、資料類型、出處題名、關鍵詞、著者、語言,這些後分類都是書目匯入時既有的metadata欄位,若是能為書目做佛學類別專門詞彙的標記,並且將標記做為後分類提供給使用者,將更有利於研究人員對於書目資料的篩選及整理。 本研究旨在於為臺大佛學數位圖書館的書目資料進行標記,新增三個標記類別:佛教宗派、佛教人物、佛教經典。事先收集這些類別的專門詞彙進行字串比對實現自動標記,並建立停用詞表,以利為字串比對的專門詞彙進行篩選,搭配人工輔助檢核標記,專門詞彙、停用詞表以進行更新,並為臺大佛學數位圖書館的書目檢索系統新增三種不同的後分類:「提及:佛教宗派」、「提及:佛教人物」、「提及:佛教經典」,隨著專門詞彙及停用詞表的完整,期待能夠帶給使用者較為準確的標記及後分類,為使用者帶來更佳的使用體驗。
NTU Digital Library of Buddhist Studies has a large collection of bibliographies of Buddhist studies and a comprehensive bibliographic search system for researchers to access Buddhist materials. Based on bibliographic metadata, the bibliographic search system of NTU Digital Library of Buddhist Studies provides six types of post-categories of query results: publication years, media types, source topics, keywords, authors, and languages. If the bibliographies can be tagged with specific vocabularies of new categories, the categories and taggings can also be used for additional post-query classification. This will provide more beneficial for researchers to filter and organize the bibliographic data. The purpose of this study is to tag the bibliographic data of NTU Digital Library of Buddhist Studies by add three new tag categories: Buddhist sects, Buddhist persons, and Sutras. The terms of each categories are collected in advance for string matching to obtain automatic tagging. A list of stopwords is also created to facilitate the filtering of specific words for string matching and correction of tags. The lists of vocabulary and stopwords can be modified manually. We added three different categories to the bibliographic search system of NTU Digital Library of Buddhist Studies. They are ”Mentions: Buddhist Sect”, “Mentions: Buddhist Persons”, and “Mentions: Sutra”, each with a specialized vocabulary and a list of stopwords. Through post-query classification using these categories, we hope to provide better user experience.
|
Table of contents | 第一章 緒論 1 1.1研究背景與動機 1 1.2研究目的與問題 1 1.3論文架構 2
第二章 現況探討與相關文獻 3 2.1臺大佛學數位圖書館 3 2.2專門詞彙資料收集參考 5 2.2.1《佛學圖書分類法(2011年版)》 5 2.2.2DILA人名規範資料庫 5 2.2.3CBETA中華電子佛典協會 6 2.3標記工具參考 7 2.3.1Markus半自動標記平台 7 2.4本章小結 8
第三章 研究方法 9 3.1研究對象與範圍 9 3.2研究流程與方法 9
第四章 功能設計與實作 14 4.1架構設計 14 4.2資料處理 15 4.2.1書目資料表欄位新增 15 4.2.2停用詞資料表 18 4.2.3佛教宗派專門詞彙 18 4.2.4佛教人物專門詞彙 20 4.2.5佛教經典專門詞彙 24 4.2.6資料處理實作 25 4.2.7小結 27 4.3自動標記實作 29
第五章 UI功能設計與範例演示 32 5.1輔助人工檢核範例演示 32 5.2書目後分類及標記呈現 37 5.3本章回顧 41
第六章 結論與未來工作 42 6.1研究結論 42 6.2未來工作 43
參考文獻 44
|
DOI | 10.6342/NTU202202547 |
Hits | 695 |
Created date | 2022.09.20 |
Modified date | 2023.01.16 |
|
Best viewed with Chrome, Firefox, Safari(Mac) but not supported IE
|
|
|