官术网_书友最值得收藏!

基于NLP的內容理解
會員

這是一本講述如何用NLP技術進行文本內容理解的著作,也是一本系統講解NLP算法的著作,是作者在NLP和內容理解領域多年經驗的總結。本書結合內容理解的實際業務場景,系統全面、循序漸進地講解了各種NLP算法以及如何用這些算法高效地解決內容理解方面的難題,主要包括如下幾個方面的內容:文本特征表示:文本特征表示是NLP的基石,也是內容理解的基礎環節,本書詳細講解了離散型表示方法和分布型表示方法等特征表示方法及其應用場景,還講解了詞向量的評判標準。內容重復理解:詳細講解了標題重復、段落重復、文章重復的識別方法和去重算法。內容通順度識別及糾正:詳細講解了內容通順度的識別方法以及糾正不通順內容的方法。內容質量:詳細講解了多種內容質量相關的算法,以及如何搭建高質量的知識問答體系的流程。標簽體系構建:詳細講解了針對內容理解的標簽體系的建設流程和方法,以及多種相關算法。文本摘要生成:詳細講解了抽取式文本摘要和生成式文本摘要兩種流行的文本摘要生成方法,以及文本摘要的常用數據集和文本摘要評價方法。文本糾錯:詳細講解了文本糾錯的傳統方法、深度學習方法、工業界解決方案,以及常用的文本糾錯工具的安裝和使用。

李明琦等 ·軟件工程 ·7.9萬字

QQ閱讀手機版

主站蜘蛛池模板: 永宁县| 阳新县| 泸水县| 肇庆市| 遵义市| 中宁县| 亚东县| 临江市| 炎陵县| 息烽县| 镇安县| 五台县| 南丰县| 望城县| 封丘县| 镇远县| 鄂尔多斯市| 赫章县| 洱源县| 苏尼特右旗| 进贤县| 眉山市| 鹰潭市| 永和县| 屏东市| 盐边县| 松江区| 马公市| 富源县| 青岛市| 海淀区| 蒲江县| 阿巴嘎旗| 雷山县| 长治县| 泾川县| 久治县| 瑞昌市| 左贡县| 磐安县| 阳江市|