- 自制AI圖像搜索引擎
- 明恒毅
- 322字
- 2020-04-14 15:19:28
1.3 搜索引擎的一般結(jié)構(gòu)
在學(xué)習(xí)了文本搜索引擎之后,我們是否可以從文本搜索引擎抽象出搜索引擎的一般結(jié)構(gòu)呢?根據(jù)一般的抽象方法,我們可以把事物非關(guān)鍵性的特征剝離出來,而只保留其最為本質(zhì)的特征。對于現(xiàn)有技術(shù)條件下的搜索引擎,必須事先生成索引庫,再在其上進(jìn)行搜索查詢。如圖1-10所示,首先需要對輸入數(shù)據(jù)進(jìn)行一定的預(yù)處理,以使我們可以對其進(jìn)行進(jìn)一步分析。接下來,把文本搜索引擎的詞法、語法分析等語言處理階段抽象為對輸入數(shù)據(jù)的特征提取,一個(gè)個(gè)提取出來的詞就是構(gòu)成一個(gè)文檔特征向量的基本元素,反向索引庫就是特征和文檔對應(yīng)關(guān)系的集合。對于查詢數(shù)據(jù),我們也要抽取其特征,然后計(jì)算它的特征向量與索引庫中所有特征向量的相似度,最終返回規(guī)定數(shù)量的相似結(jié)果。

圖1-10 抽象搜索引擎結(jié)構(gòu)
推薦閱讀
- GIMP 2.6 cookbook
- 攝影照片修飾完全自學(xué)手冊
- 計(jì)算機(jī)·手機(jī)生活應(yīng)用
- 3dsMax 2018動(dòng)畫制作基礎(chǔ)教程(第4版)
- Moldflow 2021模流分析從入門到精通(升級版)
- UG NX 8.0模具設(shè)計(jì)教程
- 3ds Max/VRay印象燈光/材質(zhì)/渲染技術(shù)精粹Ⅲ
- 從零開始:Indesign CC 2019設(shè)計(jì)基礎(chǔ)+商業(yè)設(shè)計(jì)實(shí)戰(zhàn)
- Cassandra High Performance Cookbook
- 設(shè)計(jì)必修課:Axure RP 9互聯(lián)網(wǎng)產(chǎn)品原型設(shè)計(jì)
- Inkscape 0.48 Essentials for Web Designers
- 剪映短視頻制作從入門到精通(手機(jī)版+電腦版)
- 中文版Photoshop CS6建筑效果圖后期處理技法
- 音樂制作7天速成:Studio One編曲教程
- SPSS統(tǒng)計(jì)分析入門與應(yīng)用精解(視頻教學(xué)版)