- 數字出版實用教程(第二版)
- 黃孝章 周健華 張志林
- 466字
- 2020-04-22 12:48:49
1.3.3 數字化加工的通用格式與規范
(1)數字化加工通用格式
目前,在各種電子終端上顯示閱讀的電子書,是經過非結構化數據加工的各種格式電子文檔。其中,最有代表性的格式有兩種:一種是可移植文檔格式(Portable Document Format),簡稱PDF格式;另一種是電子書格式(Electronic Publication),簡稱ePub格式。ePub是目前國際上興起的能夠跨越互聯網平臺和移動通信平臺的格式。另外,國內一些數字出版公司也開發應用了各種電子書閱讀格式,如同方CAJ、方正CEB、超星PDG、書生SEP等。目前,中國新聞出版信息化技術委員會正在進行數字出版標準體系研究,其中,涉及數字出版的十多個細分領域的標準,包括制定電子書數字出版標準。可以預見,電子書數字出版標準會出現逐漸采用通用格式的趨向。
(2)數字化加工規范作用
目前國內很多數據加工單位制作PDF格式文件,使用的參數不統一,造成的影響是:①其成品對后期PDF數據的反解和格式轉換軟件的開發帶來很大不便;②有些重要的參數也被忽略,如“字體嵌入”,導致PDF格式在轉換及文本分析時產生亂碼。為了避免后續應用帶來的制約,需要在數字化加工中制定PDF加工規范,用規范引導和保證加工成品的各種重用需求。