內容提要

自然語言處理是一門融語言學、計算機科學、數學于一體的科學，研究人與計算機之間用自然語言進行有效通信的各種理論和方法。計算語言學是指通過建立形式化的數學模型來分析、處理自然語言，并在計算機上用程序來實現分析和處理的過程，旨在以機器來模擬人的部分或全部語言能力的目的。

本書作為一本借助于Python編程語言以及各種開源工具（如Gensim、spaCy等）來執行文本分析、自然語言處理和計算語言學算法的圖書，從應用層面介紹了相關的理論知識和所涉及的技術。本書共分為15章，其內容涵蓋了文本分析的定義、使用Python進行文本分析的技巧、spaCy語言模型、Gensim工具、詞性標注及其應用、NER標注及其應用、依存分析、主題模型、高級主題建模、文本聚類和文本分類、查詢詞相似度計算和文本摘要、詞嵌入、使用深度學習處理文本、使用Keras和spaCy進行深度學習、情感分析與聊天機器人的原理介紹等。

本書適合對自然語言處理的實現細節感興趣的Python程序開發人員閱讀。如果讀者具備統計學的基本知識，對學習本書內容會大有裨益。

官术网_书友最值得收藏!

自然語言處理與計算語言學

內容提要