- 全球科學數據出版態勢分析報告(2016—2020)
- 周園春等
- 5字
- 2024-03-22 20:25:12
第1章 緒論
1.1 科學數據出版的發展歷史回顧
廣義的科學數據出版是將科學數據實體文件及相關描述信息通過網絡方式公開發布,使科學數據得以開放共享的行為與實踐,它伴隨著科學數據的產生而存在[10]。從出版語義的角度,科學數據出版是使科學數據獲得“可溯源、可引用、質量可信、作者貢獻可評價、可長期保存”等特征的活動和過程。作為一種正式的出版行為,數據出版不僅可以揭示數據科學質量和重要性,還能夠為數據生產者帶來聲譽。數據出版同時是對數據長期保存的承諾,面向數據消費者的數據增值服務。從概念辨析的角度,數據出版與數據發表、數據發布、數據開放既關聯又有區別[11]。
科學數據開放共享最早可追溯至1957—1958年間舉辦國際地球物理年會時所創建的World Data Center系統。該系統明確要求數據必須以“機器可讀取”的格式存儲,并盡可能增強數據的獲取性[12]。數據開放共享實踐主要是通過數據中心、數據倉儲、機構知識庫、數據服務網站等多種形式來發布和共享數據的。隨著開放政府數據運動的推進,歐美等國家和地區及一些國際組織積極建設各種數據門戶,幫助數據用戶發現和利用政府數據和政府資助科研項目數據[13]。
隨著科學數據開放共享的發展,學術界對科學數據出版的關注也不斷深入。2010年,國際科技數據委員會(Committee on Data for Science and Technology, CODATA)在其年會上提出了“數據出版”(Data Publishing)的概念。2011年,國際科學理事會世界數據系統(World Data System, WDS)舉辦了“數據出版”主題討論[10]。
早期,科學數據出版更多是期刊機構在發表論文時為了防止科研數據造假,保證學術論文結論與數據的可再現性及數據被復用[14],要求作者將相關數據以附件形式進行出版。例如,Science、Nature、BMC等諸多學術期刊及出版社均對科研數據的存儲及傳播規定明確政策,要求作者在發表論文時按照期刊的數據要求提交科研數據,并將共享原始數據集作為論文發表的條件之一[15]。
隨著科技的飛速發展,科學數據在數據密集型科研范式的科研活動中已成為越來越重要的支撐要素,科學數據出版也日漸由期刊出版商驅動的以附件形式發表的傳統科學數據出版拓展到科研領域眾多主體協同合作、共同推動的數據論文發表的科學數據出版方式,并成為促進科學數據共享的有效途徑之一,受到數據共享領域和出版界的高度重視。這種科學數據出版是對“數據及其信息”進行“出版”,由“提交數據、存儲數據、質量評審、發表數據信息,以及對數據引用和評價”等關鍵環節構成基本的數據出版體系[14]。
尤其是21世紀以來,各類數據存儲庫和數據共享平臺不斷發展,不僅可以直接發布數據,作為傳統期刊附件材料的存儲依托,還陸續出現了專門出版數據論文的新型數據期刊,如Earth System Science Data、Biodiversity Data Journal、Scientific Data等[10]。此外,從時間及數量規模上看,獨立數據出版歷史悠久,已經形成龐大的出版規模。數據論文出版的出現時間較短,在年度出版數量上雖然增加迅速,但是從規模上看仍然處于初期發展階段[16]。