深度實踐OCR:基于深度學(xué)習(xí)的文字識別
這是一部融合了企業(yè)界先進(jìn)工程實踐經(jīng)驗和學(xué)術(shù)界前沿技術(shù)和思想的ORC著作。本書由阿里巴巴本地生活研究院算法團(tuán)隊技術(shù)專家領(lǐng)銜,從組件、算法、實現(xiàn)、工程應(yīng)用等維度系統(tǒng)講解基于深度學(xué)習(xí)的OCR技術(shù)的原理和落地。書中一步步剖析了算法背后的數(shù)學(xué)原理,提供大量簡潔的代碼實現(xiàn),幫助讀者從零基礎(chǔ)開始構(gòu)建OCR算法。全書共9章:第1章從宏觀角度介紹了ORC技術(shù)的發(fā)展歷程、概念和產(chǎn)業(yè)應(yīng)用;第2章講解了OCR的圖像預(yù)處理方法;第3~4章介紹了傳統(tǒng)機器學(xué)習(xí)方法和深度學(xué)習(xí)的相關(guān)基礎(chǔ);第5章講解了基于傳統(tǒng)方法和深度學(xué)習(xí)方法的OCR的數(shù)據(jù)生成;第6章講解了與OCR相關(guān)的一些高級深度學(xué)習(xí)方法,方便讀者理解后續(xù)的檢測和識別部分;第7章講解了文字的檢測技術(shù),從通用的目標(biāo)檢測到文字的檢測,一步步加深讀者對文字檢測問題的認(rèn)識;第8章討論了文字識別的相關(guān)技術(shù),定位到文字的位置之后,需要對文字的內(nèi)容進(jìn)行進(jìn)一步的解析;第9章介紹了一些OCR后處理的方法。
·12.5萬字