- 社會史研究(第9輯)
- 行龍
- 5102字
- 2021-05-11 15:06:12
一 “清代自然災害信息集成數據庫”的結構
(一)數據庫概述
“清代自然災害信息集成數據庫”是“清代災荒紀年暨信息集成數據庫建設”項目的三項主要研究內容之一,另兩項分別是編纂《清代災賑史料長編》和撰寫《清代災荒紀年》。其中,《清代災賑史料長編》是從清代的海量史料中挖掘和整理有關災害的記載,以年代為經,以省區為緯,按正史、實錄(含《宣統政紀》《東華錄》等)、政書、檔案、方志、報刊、詩文集、日記以及其他文獻等類別,依序排列史料,并按統一規范注明資料來源,以便查考。“清代自然災害信息集成數據庫”是以《清代災賑史料長編》為基礎建立的,是一個包括自然變動與社會響應等各方面信息在內的綜合性的大型災害信息集成系統,它與《清代災賑史料長編》一起,構成一個動態的、與時俱進的災害信息累積式擴展系統,任何在史料和研究上的新發現、新進展以及項目在有限時間內難以收羅的其他史料,均可隨時輸入其中。[12]
“清代自然災害信息集成數據庫”基于全要素(涵括災害在自然和社會層面的所有要素)、全災種(收錄所有記錄的災害)、全過程(關注災前、災時、災后,以及時人的災害認知等多方面情況)、全文獻(實現與清代災害有關的文獻和實物資料的全面收錄)、全功能(涵蓋目前技術能夠開發的各類功能)、全歷史(創造條件將時段從清代擴展到整個歷史時期)、全地域(按照歷史時期的疆界處理史料和討論問題)的原則建設,所收錄的災害信息,突破以往以單一地區、單一災種為主要內容的資料匯編形式,力求將歷年各省區市各類自然災害包含其中,便于揭示各災種之間的關聯,從整體上反映災害演變大勢。在文獻資料方面,最大限度地涵括正史、實錄、政書、檔案、方志、報刊、詩文集、日記以及其他各類相關文獻中的災害信息;在災害類型方面,不僅包括水災、旱災、地震,也包括蝗災、雹災、潮災、山崩、滑坡、泥石流、雪災、火災等各類災害,還涵蓋農作物異常豐收等特殊氣候、物候現象;在災害內容方面,兼顧自然與社會兩個方面,不僅包括自然災害過程,也包括由此引起的社會變動和反應。
作為一個完整的清代自然災害信息集成系統,“清代自然災害信息集成數據庫”由數據庫和網頁平臺兩部分組成(見圖1),是一個融資料的采集整理、存儲更新、查詢檢索、校核比勘,以及數據統計分析、制表繪圖、動態演示等多種信息處理功能為一體的巨大系統。整個數據庫設計為一個開放式的公共交流平臺,供相關研究者使用,同時希望相關研究者能夠通過此平臺之各個環節、各個層級,對數據庫建設做出反饋,從而以一種互動的方式推動數據庫的建設、維護和發展。
圖1 “清代自然災害信息集成數據庫”的結構及功能設計
(二)數據庫總體結構
“清代自然災害信息集成數據庫”的數據庫是利用MySQL搭建的數據庫,主體是原始記錄庫模塊,預留可擴展的原始文獻庫和專題數據庫等數據庫模塊。
原始記錄庫用于存儲從各類原始文獻中摘錄提取的有關災害的信息,由原始記錄表和原始校核表兩部分組成。其中,原始記錄表是最主要的部分,它以每一條記錄為單位,將提取出的災害記錄數字化,并將有關信息分解為不同字段進行存儲,從而可以通過災害的類型、時間等信息進行檢索查詢、統計分析等。原始記錄表中的每一條記錄都可與原始文獻庫中儲存的原始災害文獻相鏈接,以便必要時與原始文獻進行對比、校核。原始校核表用于存儲校核過的信息,每條校核過的記錄與原始記錄庫中的對應記錄建立鏈接。
原始文獻庫用于存儲原始記錄庫中所摘錄的有關災害記錄的原始文獻,包括圖片、PDF等數據類型,作為底層的資料庫與原始記錄庫相互鏈接。其中對于收錄的一些數據量十分龐大的史料,如某人日記、某災害紀略等文獻,可單獨形成一個子數據庫,作為原始文獻庫的一部分。
專題數據庫是依據不同的研究主題,對原始記錄庫進行篩選、拆分、集成而派生出的數據庫。其主題、時空范圍都視研究者的目的而定,可以某個災種為主題建立專題庫,如臺風專題數據庫、洪澇專題數據庫、干旱專題數據庫等;也可以針對某一次重大災荒建立專題案例庫,如“丁戊奇荒”專題庫等;還可以某一政區單元或某一朝代建立專題數據庫,如山西省專題數據庫、乾隆朝專題數據庫等。專題數據庫的建立一般經過從原始記錄表到派生數據表再到合成數據表三個步驟。原始記錄表是從原始記錄庫中,按照一定的標準篩選、整理而成的;派生數據表是由原始記錄表生成的中間層,分別與原始記錄表和合成數據表相鏈接,將原始記錄表中的每條記錄進行拆分、量化,還可依據研究目的增減字段,具有較高的靈活性和較大的操作空間;合成數據表是由派生數據表生成的,為了實現定量指標序列提取、空間分析等功能,需要在屬性數據和空間數據間建立一一對應的關系,因此對同一時間、同一地點的多條記錄,要從記錄內容、資料出處、時空關聯等方面進行比較、拆補與剔除,最終將其合成一條記錄。
(三)原始記錄表的結構
原始記錄表存儲原始記錄庫中所摘錄的災害記錄,是數據庫的核心所在。將從災害史料中所提取的原始記錄中的文本信息盡可能準確、完整地轉換成現代信息技術所需的數量指標,既是數據庫正常運轉的前提,也是用戶通過數據庫順利獲知有關信息的保證。
原始記錄表將所提取的每條原始災害記錄所展示的信息劃分為原始信息、基礎信息、災害信息、文獻信息和輔助信息五類,每類又可進一步細分為若干字段,一共有29個字段(見表1)。
1.原始信息
原始信息共包括5個字段。“原始記錄內容”是整個數據庫的記錄核心,它將原始文獻中涉及災情、救災、備災等的記錄均完整抄錄存儲,若原文缺具體的時間、地點等信息,但可借助其他證據進行推斷,則予以補充;若原文中確有明顯的錯、漏、衍字,則予以校正。經過考證進行補充、修改的信息也一并記錄其中,并在“考證備注”欄內說明。“題名”記錄檔案、報刊、文集、筆記、方志、碑刻等史料中有關文獻的具體篇名等。“作者”指各條記錄明確提及或通過考證確認的作者,包括相關奏疏的奏報人,報刊通訊、時評及論文的作者,方志藝文志收錄的詩文作者等。“提要”是對原文主要信息的概括和分類,分災害類型、災情、救災備災三大類。針對“關鍵詞”字段已建立了《原始記錄主題詞表》,可對應填寫,不局限于災害類型和災害過程。
表1 原始記錄表結構
續表
“原始記錄內容”摘錄于清代涉及災害發生、影響及應對等方面的各類原始文獻,包括清代已刊或后世整理的紙質出版或數字化的文獻等,主要包括九大類。
(1)正史類,如《清史稿》。
(2)實錄類,包括順治至光緒朝歷代帝王實錄、《宣統政紀》以及《東華錄》等。
(3)政書類,包括記載清代典章制度和政務活動的各類政書,如《清朝通典》《清朝通志》《清會典》等,以及以災荒為中心內容的荒政書——《中國荒政書集成》等。
(4)檔案類,包括各種綜合或專題、清宮或地方的檔案資料,如《上諭檔》(乾隆至宣統朝)、《清代干旱檔案史料》、《西藏地震史料匯編》以及“國家清史工程數字資源總庫”中的檔案資料。
(5)地方志類,包括各地縣、府、省級的方志資料,其“災異”“祥異”“恤政”“河渠”“人物志”“藝文志”等部分都可能有災害相關記載。主要來源于《中國方志叢書》《中國地方志集成》中收錄的方志,以及各種網絡資源,如“中國數字方志庫”、“中國方志庫”(愛如生數據庫)等。
(6)報刊類,主要包括近代各類中英文報刊,除價值最高、信息最豐富、時間連續性最長的《申報》外,還包括《萬國公報》《東方雜志》《中國叢報》等,以及網絡資源如“晚清期刊全文數據庫(1833~1911)”。
(7)詩文集類,包括各類清人文集,如《清代詩文集匯編》《皇朝經世文編》《曾國荃全集》等。
(8)日記類,主要來源于已出版的《歷代日記叢鈔》及網絡資源“近現代日記全文檢索數據庫”。
(9)其他類,內容龐雜但同樣是重要的資料來源,包括各地碑刻、清人傳記、譜牒、外文史料等。
2.災害信息
災害信息提取了與災害直接相關的信息,包括“災害類型”、“災害過程”和“災害級別”3個字段。前兩者采用數字編碼,存儲原始記錄中記載的所有災害類型及過程。
圖2 災害類型劃分及編碼示意
災害類型按照現行自然災害劃分的國家標準(GB/T 28921—2012)進行劃分,包括氣象水文災害、地質地震災害、海洋災害、生物災害、生態環境災害、人為災害、其他等;此外,還根據中國史料記載的內容,增加了“異常現象”、“不明原因的災、荒、歉”以及非災害年份中的“大有年”(農業豐收年)3種特殊類型,一共可分為9類38種,每種災種規定了對應的數字編碼(見圖2)。其中,“異常現象”包括天文、氣象、水文、地貌等方面,例如太陽黑子、日食、氣溫異常(冬暖春熱)等與災害并不直接相關的現象。“不明原因的災、荒、歉”和“大有年”均屬于對收成情況有異于平常年份的記錄,且從原始記錄中不能判斷收成異常的原因。將災害發生的自然過程、影響以及響應等過程共劃分為異常現象、致災過程、災害影響、災害防備、災害應對、災害認知及其他七個環節(見表2)。“災害級別”字段為預留字段,在原始記錄表中暫未填寫。
表2 災害過程編碼規則及示例
3.文獻信息
文獻信息部分共包括5個字段,其中“史料類型”與數據來源中的九大類史料相對應,以數字編碼的形式存儲,分別是:01-正史、02-實錄、03-政書、04-檔案、05-方志、06-報刊、07-詩文集、08-日記及09-其他。“直接來源”和“原始出處”分別以一定的標準格式標注了原始記錄的出處。“直接來源”系后人整理或影印的涉及清代原始史料的文獻,如《清史稿》《清實錄》《中國地方志集成》《中國方志叢書》《中國荒政書集成》《中國三千年氣象記錄總集》,以及已出版的清代各類檔案匯編等,并標明纂修者、文獻名、卷冊、出版社、出版時間及頁碼。“原始出處”為直接載有著錄信息的原始文獻,如某地方志、某文集、某報刊等的原件或目前可見的最早版本,均標明該文獻的修撰者、文獻名、卷冊、原始頁碼、版本。“考證備注”用于標注歷史記錄錄入及處理過程中的增減、修改、補充、校核等過程,以便查驗。“原始文獻鏈接”為與原始記錄庫(文件夾)鏈接地址,它的功能是可在原始記錄庫和原始文獻庫之間建立鏈接,使每一條原始記錄都能找到相對應的原始文獻文件。
4.輔助信息
輔助信息部分共包括4個字段。ID1為系統自動生成的ID,具有唯一性,用于在原始記錄表和原始校核表之間建立鏈接。KeyID是由成災年份和史料類型組成的6位數字,作為每條記錄的特征碼。“預留字段”是為功能擴展預留的空間,“責任人”則記錄參與處理該條數據的所有工作人員。
(四)網頁平臺
“清代自然災害信息集成數據庫”的網頁平臺主要用于將數據庫所收錄數據通過互聯網技術實現在不同用戶群體中的交流共享。該平臺以PHP作為腳本語言搭建,具備簡單便捷的操作界面、不同尺度的共享權限、直觀的數據輸出方式等特點和功能,還針對用戶需求對數據庫的運行環境、開發平臺進行升級和調整,開發出可實現多尺度共享的網頁界面。網頁平臺也可以隨著版本升級更新變化,其界面也可隨之發生改變,以實時實際的界面為準。
1.用戶登錄
“清代自然災害信息集成數據庫”的使用者可通過服務平臺主頁面的“用戶名”和“密碼”遠程登錄系統。服務平臺對管理員賬戶和用戶賬戶設置了不同的權限。管理員賬戶享有數據庫全部信息,可對數據庫進行增刪維護;用戶賬戶享有包括文獻記錄原文、簡單的時間地點信息、文獻所記錄的災害信息和文獻本身的版本、來源信息在內的數據庫信息。
用戶登錄成功后,根據權限的不同,選擇進入“檢索”界面或“管理”界面,以實現對災害記錄的查詢檢索、統計分析、留言糾錯、數據維護。此外,平臺在“幫助”界面提供了數據庫的使用說明,供用戶參考使用。用戶使用結束后,可點擊“注銷”按鈕注銷賬號(見圖3)。
圖3 “清代自然災害信息集成數據庫”界面
2.檢索界面
用戶可選擇進入基礎檢索或高級檢索界面進行檢索。在基礎檢索界面,在“檢索類別”中下拉選擇“時間”、“地點”和“關鍵詞”中任意一項進行檢索,在“檢索內容”框中輸入相應的檢索內容,點擊“檢索”按鈕,即可得到滿足相應條件的檢索結果。在高級檢索界面,可以在多項檢索字段下框內輸入相應的檢索內容(見圖4),得出同時滿足多個檢索條件的交集結果。
檢索到的記錄生成一個臨時性的數據表,在每條記錄的末尾,有報錯選項,用戶可以點擊反饋該條記錄中的錯誤。
檢索得到的記錄可以直接進行復制粘貼,統計分析后的圖表結果也可儲存為p######ng、j######pg等格式保存到本地文件夾。
圖4 “清代自然災害信息集成數據庫”高級檢索界面
3.管理界面
管理界面主要用于平臺管理人員添加和修改數據,并對用戶反映情況進行反饋。管理者可通過此界面添加數據,既可逐條添加或批量添加,亦可對發現的錯誤數據進行修改完善,還可以創建并分享專題數據庫,不斷豐富和拓展專題數據庫的數量和內容。