- 自制AI圖像搜索引擎
- 明恒毅
- 743字
- 2020-04-14 15:19:26
序
大約十年前的某一天,我正徜徉在互聯(lián)網(wǎng)的世界里,忽然一個名叫“TinEye”的圖像搜索引擎網(wǎng)站映入我的眼簾。我滿懷憧憬地在那個網(wǎng)站中上傳了一幅圖片,它很快搜索并返回了許多這幅圖片在互聯(lián)網(wǎng)中不同URL上的結(jié)果。我接著嘗試上傳了另一幅圖片,一會兒它又返回了許多近似這幅圖片的結(jié)果,很顯然,結(jié)果中的很多圖片是在同一幅圖像上修改的。面對如此準(zhǔn)確和令人驚艷的結(jié)果,我不禁腦洞大開、浮想聯(lián)翩,構(gòu)思著一個個可以運用該技術(shù)實現(xiàn)的奇思妙想。猛然間,我覺得心中產(chǎn)生了一股強大的力量——我要弄懂它背后的技術(shù)原理。
為了徹底弄清楚這類圖像搜索引擎的技術(shù)原理,我反復(fù)查找和閱讀當(dāng)時互聯(lián)網(wǎng)上甚為稀缺的相關(guān)資料,但收效甚微。直到后來,我遇到了一個叫作LIRE的開源項目,它讓我初步理解了圖像搜索引擎的技術(shù)原理。但是在實際應(yīng)用中,LIRE的效果并不是太好。為了解決這個問題,我又找到“深度學(xué)習(xí)”這個強有力的助手。在探索原理的過程中,我發(fā)現(xiàn)國內(nèi)幾乎找不到一本介紹圖像搜索引擎基本原理和實現(xiàn)的書,這也成了本書誕生的緣由。
基于內(nèi)容的圖像檢索技術(shù)自20世紀(jì)90年代提出以來,得到了迅速的發(fā)展。研究人員提出了不同的理論和方法,其中具有代表性的是SIFT、詞袋模型、矢量量化、倒排索引、局部敏感散列、卷積神經(jīng)網(wǎng)絡(luò),等等。與此同時,產(chǎn)業(yè)界也推出了許多實用的圖像搜索引擎,比如TinEye、谷歌圖像搜索、百度圖像搜索和以淘寶為代表的垂直領(lǐng)域圖像搜索引擎。但是到目前為止,此項技術(shù)還遠未完全成熟,還有許多問題需要解決,改進和提高的空間還很大。搜索的結(jié)果和用戶的期望還有一些距離,存在一定的圖像語義鴻溝。這也是從事這項技術(shù)研究與開發(fā)的人員不斷進步的源動力。
希望本書的出版能夠在一定程度上緩解圖像搜索引擎資料稀少的現(xiàn)狀,并能夠吸引和幫助更多的技術(shù)人員關(guān)注并研究圖像檢索技術(shù)。
明恒毅
2018年11月
- RAW攝影后期從入門到精通:Photoshop+Lightroom雙修精解
- Maya影視動畫高級模型制作全解析
- DWR Java AJAX Applications
- 中文版Illustrator CC基礎(chǔ)培訓(xùn)教程(移動學(xué)習(xí)版)
- ABAQUS基礎(chǔ)入門與案例精通
- SolidWorks2014基礎(chǔ)實例教程
- Premiere pro CC中文版自學(xué)視頻教程
- Photoshop CS6從入門到精通
- 正則表達式必知必會(修訂版)
- Plone 3 Intranets
- NX Open API編程技術(shù)
- 中文版InDesign CC平面排版設(shè)計從入門到精通
- 從零開始:Dreamweaver CS6中文版基礎(chǔ)培訓(xùn)教程
- Service Oriented Architecture with Java
- Cinema 4D R20完全學(xué)習(xí)手冊