書名: 自制AI圖像搜索引擎作者名: 明恒毅本章字數: 166字更新時間: 2020-04-14 15:19:27
1.2 文本搜索引擎的結構與實現
目前,基于文本信息的搜索引擎雖然還有一定的提升空間,但其工作原理已經相對穩定,基本結構也已趨于成熟。文本搜索引擎基本可以分為抓取部分、預處理部分、索引部分、搜索部分以及用戶接口,如圖1-1所示。

圖1-1 文本搜索引擎結構
由于抓取部分不是本書所討論的內容,故不做詳細介紹。下面來著重介紹一下文本數據預處理、索引及搜索。
推薦閱讀