搜索引擎技術與發展
本書主要介紹如何使用Java語言開發搜索引擎,包括搜索引擎技術入門,使用Java開發網絡爬蟲,實現從文檔中提取索引內容,中文分詞的原理與實現,在Linux服務器端開發Solr應用,SpringBoot微服務框架實現的后端,以及React框架實現的前端等內容。第1章主要介紹各種類型的搜索引擎和開發搜索引擎可以借助的軟件工具;第2章主要介紹網絡爬蟲開發和數據存儲;第3章主要介紹從HTML文件中提取文本,以及從PDF、Word等非HTML文件中提取文本;第4章主要介紹Lucene中的中文分析器的原理與實現;第5章主要介紹Solr索引庫的創建與維護,以及Solr的查詢解析器;第6章主要介紹Web方式搜索結果界面的實現;第7章主要介紹如何使用SolrCloud實現分布式搜索。
·4.4萬字