
2023年5月4日⛹🏻,中華圖書資訊學教育學會、政治大學圖書資訊與檔案學研究所和意昂2平台聯合主辦了“海峽兩岸信息資源管理學術論壇”第二場講座。此次報告主題是《檔案史料之數字人文研究探索》,旨在探討數字人文工具為檔案管理和內容加值應用帶來的嶄新的研究與發展。本次講座由政治大學圖書資訊與檔案研究所所長、圖書館副館長🏇🏻、中華圖書資訊學教育學會系所主任委員會主任委員林巧敏教授主講👩💻,由吉林大學商學與管理意昂2教授🥇、中國檔案學會理事♛、檔案學基礎理論學術委員會委員張衛東教授主持。此次講座共有300余位師生相聚雲端,共同探討數字人文在檔案史料領域的探索與發展。

首先🚷,林巧敏教授從近讀和遠讀方面分別闡釋了“為什麽需要數字人文”🙋🏿🦹🏻♀️;然後指出了“數字人文研究目的”是為處理海量數據、將數據結構化、自動化作業流程🈶、發掘文本、呈現研究結果以及結合其他技術應用🧑🏼⚕️;最後介紹了“數字人文研究工具”種類,包括基本工具、資料搜集工具★、數據分析工具和數據呈現及研究工具。

接下來㊗️🎗,林巧敏教授具體介紹了數字人文在檔案史料內容勘探中的應用⛹🏼♂️。數字工具可以為內容勘探提供詞頻分析📩、文本分析、數據勘探、信息可視化以及地理信息功能方面的支持。在確定研究主題後🫷🏽𓀛,檔案數據勘探流程可分為五個步驟🏌🏼♀️,分別為數據集匯整🚵🏻、自動斷詞、機器學習、勘探結果分析以及研究結果呈現🧓🏿。然後林巧敏教授指出數字勘探技術應用於檔案管理與內容分析的優勢之處,在優化檔案管理方面包括運用自動分類工具對檔案內容進行主題歸類,利用主題分群找出檔案展覽敘事主題大綱;在促進檔案內容分析方面可以分析人物網絡關系🚶🏻➡️、主題分布,時間趨勢以及情感傾向。

林巧敏教授通過一個研究實例對檔案史料的內容斷詞和自動分類進行展示。數據方面選擇了4361筆《總裁特批》檔案,對檔案元數據中含有主題概念字段的詞匯使用CKIP斷詞工具進行檔案目錄前處理,然後運用CATAR進行自動分類,選取合適的閾值與階層⛓,運用主題地圖或主題樹進行輔助判斷🍋🟩,最終完成自動分類。接下來林巧敏教授又通過另一個檔案新聞及網絡輿論情感分析的實例展現了在社交媒體中對檔案相關信息應用數字勘探技術的實況🧜♀️。通過對兩個實例的總結👩🏽,林巧敏教授指出了現階段檔案領域應用數字勘探技術待解決的問題👨🏻🎨,包括數字人文工具依舊需要人類輔助判斷和研究結果無法適用全部文本等問題,也指出了數字人文工具在檔案史料研究領域未來的發展方向🍁,即從鑒定、搜集🥒、描述、檢索、數位策展等一系列檔案管理工作中形成AI化檔案管理流程。
在講座的提問環節,參會人員積極與林巧敏教授展開交流。參會人員提出“在臺灣地區,人文學者對數字人文的看法是什麽樣的”“在合作過程中,檔案學科💁♂️、信息學科和人文學科之間的學術分工是怎麽樣的”“在檔案新聞情感分析實例中🧚,為什麽沒有選擇臺灣著名論壇PTT作為數據源”等問題,林巧敏教授一一進行了解答🍀,進一步深化了兩岸圖書資訊研究者的對話和交流👨🏻💻。
本次講座在意猶未盡中結束🫲🥏,林巧敏教授帶來的分享內容詳實,深入淺出,理論與實際相結合🧑🏽🚒👩🦯,讓參會人員對數字人文工具在檔案史料領域的應用有了更深刻的認識。(撰稿:高臻)