- 數字出版實用教程(第二版)
- 黃孝章 周健華 張志林
- 1473字
- 2020-04-22 12:48:50
1.6.4 PDF文檔加工
(1)PDF文檔加工要求
PDF文檔加工要求內容完整,無缺頁、重頁、頁碼順序顛倒的情況;根據圖書目錄添加書簽,書簽內容從文本中復制,同時檢查是否與紙質書一致,并刪除多余空格,使得書簽內容文字差錯率小于三萬分之一。并設置文檔屬性,使得打開PDF文件時,自動顯示書簽,且書簽只展開到第一級目錄;PDF初始放大率設置為“適合頁面”,書簽動作縮放比例設置為“承前縮放”。對PDF文檔的加工一般有兩種需求:第一種為雙層PDF;第二種為版式還原的純文本單層PDF。
(2)雙層PDF文檔加工
利用導入軟件將中間文件的信息導入到專業排版工具中進行初步批量排版,批量排版可以把原書字體、字號、行距等信息批量處理并導出符合要求的PDF文件,導出的PDF文件中的文字及圖像位置信息將與原書基本一致,至此將形成初步排版的版面文件。
添加書簽,根據圖書目錄添加書簽,書簽內容從文本中復制,同時檢查是否與紙質書一致,并刪除多余空格,使得書簽內容文字差錯率小于三萬分之一。并設置文檔屬性,使得打開PDF文件時,自動顯示書簽,且書簽只展開到第一級目錄;PDF初始放大率設置為“適合頁面”,書簽動作縮放比例設置為“承前縮放”。
終審,檢查每個PDF數據的完整性,是否有缺、重頁,頁碼順序顛倒,頁面尺寸大小是否一致,版心是否居中、一致,頁眉線是否有鋸齒現象,書簽設置是否有誤,內容字體是否嵌入,缺字是否矢量造字等。通過終檢以上問題,確保每個PDF的綜合差錯率控制在三萬分之一以內。
雙層PDF圖像層的要求與圖像PDF相同,精度一般為300 dpi。圖像層和文字層的文字對位準確,反顯區域與文字區域相差控制在1毫米以內。圖1-12表示的是PDF圖像層與文字層錯位,尚未對齊的情況。

圖1-12 PDF圖像層與文字層尚未對齊示例
在雙層PDF文檔加工時,TIF圖在下面,中間文件調用的文字層呈透明狀在上面,調整文字層以對準TIF圖。在顯示閱讀時,上層看到的是TIF圖,選中需要進行標注時的內容則是在文字層。雙層PDF文檔顯示對準的情況如圖1-13所示。

圖1-13 PDF圖像層與文字層對齊示例
在采用雙層PDF文檔進行閱讀時,上層展現原圖的圖像文檔,有兩點需要說明:
①帶有復雜公式、表格的單元不會在雙層PDF時使用,不用再對公式、表格圖像進行專門的切圖處理。
②在雙層PDF文檔中,加工文字層統一為宋體。
(3)版式還原的純文本單層(精排)PDF文檔加工
單層PDF要求與雙層PDF中的文字層大致相同,版式還原的純文本單層PDF文檔加工也叫做精排。排版人員使用專用排版工具進行人工精確排版。操作員根據原書圖像通過改變正文、頁眉頁腳字體、字號、類型,標注上下標,換頁眉線等一系列操作完成精確排版工作,排版的文件版式與原書內容保持一致。最后導出符合合同要求、符合國際標準的PDF文件。
有兩點需要說明:
①要求版式與原紙質圖書保持一致。部分沒有或者難以辨別的字體可用相似字體代替。圖1-14展示的是版式還原的純文本單層PDF文檔,它在圖書的原有版式中,將文字內容以純文本方式展現。

圖1-14 版式還原的純文本單層PDF示例
②生僻字造字問題。由于文字本身是矢量,不使用圖片,因此碰到生僻字時,要求用矢量造字補缺。在補字對應的文本處統一用“■”表示。就是說,需要另行造字,再替補黑方塊所代表的字。圖1-15表示了生僻字的造字顯示。

圖1-15 生僻字的造字顯示
將形成矢量的生僻字植入純文本單層PDF文檔中的情況如圖1-16所示。

圖1-16 植入單層PDF中新造的矢量字
(4)加工成品檢查
檢查每個PDF數據的完整性:①是否有缺、重頁,頁碼順序顛倒;②頁面尺寸大小是否一致,版心是否居中、一致;③頁眉線是否有鋸齒現象;④書簽設置是否有誤;⑤內容字體是否嵌入;⑥缺字是否矢量造字等。通過終檢以上問題,確保每個PDF的綜合差錯率控制在三萬分之一以內。