深度實踐OCR:基于深度學習的文字識別
這是一部融合了企業界先進工程實踐經驗和學術界前沿技術和思想的ORC著作。本書由阿里巴巴本地生活研究院算法團隊技術專家領銜,從組件、算法、實現、工程應用等維度系統講解基于深度學習的OCR技術的原理和落地。書中一步步剖析了算法背后的數學原理,提供大量簡潔的代碼實現,幫助讀者從零基礎開始構建OCR算法。全書共9章:第1章從宏觀角度介紹了ORC技術的發展歷程、概念和產業應用;第2章講解了OCR的圖像預處理方法;第3~4章介紹了傳統機器學習方法和深度學習的相關基礎;第5章講解了基于傳統方法和深度學習方法的OCR的數據生成;第6章講解了與OCR相關的一些高級深度學習方法,方便讀者理解后續的檢測和識別部分;第7章講解了文字的檢測技術,從通用的目標檢測到文字的檢測,一步步加深讀者對文字檢測問題的認識;第8章討論了文字識別的相關技術,定位到文字的位置之后,需要對文字的內容進行進一步的解析;第9章介紹了一些OCR后處理的方法。
·12.5萬字