官术网_书友最值得收藏!

內容提要

自然語言處理是一門融語言學、計算機科學、數學于一體的科學,研究人與計算機之間用自然語言進行有效通信的各種理論和方法。計算語言學是指通過建立形式化的數學模型來分析、處理自然語言,并在計算機上用程序來實現分析和處理的過程,旨在以機器來模擬人的部分或全部語言能力的目的。

本書作為一本借助于Python編程語言以及各種開源工具(如Gensim、spaCy等)來執行文本分析、自然語言處理和計算語言學算法的圖書,從應用層面介紹了相關的理論知識和所涉及的技術。本書共分為15章,其內容涵蓋了文本分析的定義、使用Python進行文本分析的技巧、spaCy語言模型、Gensim工具、詞性標注及其應用、NER標注及其應用、依存分析、主題模型、高級主題建模、文本聚類和文本分類、查詢詞相似度計算和文本摘要、詞嵌入、使用深度學習處理文本、使用Keras和spaCy進行深度學習、情感分析與聊天機器人的原理介紹等。

本書適合對自然語言處理的實現細節感興趣的Python程序開發人員閱讀。如果讀者具備統計學的基本知識,對學習本書內容會大有裨益。

主站蜘蛛池模板: 博兴县| 全南县| 溧水县| 香河县| 怀柔区| 连山| 娄底市| 忻城县| 乐清市| 临夏市| 桑日县| 资兴市| 南昌市| 霍林郭勒市| 收藏| 柘城县| 达日县| 邯郸市| 汕头市| 青海省| 禄劝| 太仆寺旗| 重庆市| 库车县| 阿克| 泽州县| 牡丹江市| 庐江县| 岳阳市| 广河县| 沾益县| 湟源县| 常州市| 齐河县| 汝城县| 淄博市| 临安市| 永嘉县| 海门市| 伊通| 万盛区|