官术网_书友最值得收藏!

基于NLP的內容理解
會員

這是一本講述如何用NLP技術進行文本內容理解的著作,也是一本系統講解NLP算法的著作,是作者在NLP和內容理解領域多年經驗的總結。本書結合內容理解的實際業務場景,系統全面、循序漸進地講解了各種NLP算法以及如何用這些算法高效地解決內容理解方面的難題,主要包括如下幾個方面的內容:文本特征表示:文本特征表示是NLP的基石,也是內容理解的基礎環節,本書詳細講解了離散型表示方法和分布型表示方法等特征表示方法及其應用場景,還講解了詞向量的評判標準。內容重復理解:詳細講解了標題重復、段落重復、文章重復的識別方法和去重算法。內容通順度識別及糾正:詳細講解了內容通順度的識別方法以及糾正不通順內容的方法。內容質量:詳細講解了多種內容質量相關的算法,以及如何搭建高質量的知識問答體系的流程。標簽體系構建:詳細講解了針對內容理解的標簽體系的建設流程和方法,以及多種相關算法。文本摘要生成:詳細講解了抽取式文本摘要和生成式文本摘要兩種流行的文本摘要生成方法,以及文本摘要的常用數據集和文本摘要評價方法。文本糾錯:詳細講解了文本糾錯的傳統方法、深度學習方法、工業界解決方案,以及常用的文本糾錯工具的安裝和使用。

李明琦等 ·軟件工程 ·7.9萬字

QQ閱讀手機版

主站蜘蛛池模板: 门源| 葫芦岛市| 岑溪市| 济源市| 安仁县| 郑州市| 漳平市| 石首市| 泗洪县| 临猗县| 晋宁县| 怀集县| 绥棱县| 大厂| 平阳县| 伊吾县| 蒙自县| 塔河县| 宁化县| 毕节市| 广平县| 荆州市| 广州市| 施秉县| 米林县| 阿克| 南阳市| 江口县| 荆州市| 鄂州市| 永春县| 齐齐哈尔市| 朔州市| 临西县| 岳普湖县| 乌拉特后旗| 南平市| 宁晋县| 临洮县| 揭东县| 休宁县|