官术网_书友最值得收藏!

1.2 文本搜索引擎的結構與實現

目前,基于文本信息的搜索引擎雖然還有一定的提升空間,但其工作原理已經相對穩定,基本結構也已趨于成熟。文本搜索引擎基本可以分為抓取部分、預處理部分、索引部分、搜索部分以及用戶接口,如圖1-1所示。

圖1-1 文本搜索引擎結構

由于抓取部分不是本書所討論的內容,故不做詳細介紹。下面來著重介紹一下文本數據預處理、索引及搜索。

主站蜘蛛池模板: 万盛区| 随州市| 龙游县| 古浪县| 仁怀市| 安阳县| 忻州市| 冀州市| 类乌齐县| 观塘区| 墨脱县| 宁国市| 抚宁县| 班戈县| 军事| 巧家县| 盐边县| 新昌县| 毕节市| 临江市| 永胜县| 隆尧县| 阳山县| 博野县| 保康县| 日喀则市| 平顺县| 文成县| 荆州市| 开鲁县| 夏邑县| 开阳县| 江川县| 麻江县| 垫江县| 自治县| 德保县| 松滋市| 于都县| 栖霞市| 平潭县|