官术网_书友最值得收藏!

基于NLP的內容理解
會員

這是一本講述如何用NLP技術進行文本內容理解的著作,也是一本系統講解NLP算法的著作,是作者在NLP和內容理解領域多年經驗的總結。本書結合內容理解的實際業務場景,系統全面、循序漸進地講解了各種NLP算法以及如何用這些算法高效地解決內容理解方面的難題,主要包括如下幾個方面的內容:文本特征表示:文本特征表示是NLP的基石,也是內容理解的基礎環節,本書詳細講解了離散型表示方法和分布型表示方法等特征表示方法及其應用場景,還講解了詞向量的評判標準。內容重復理解:詳細講解了標題重復、段落重復、文章重復的識別方法和去重算法。內容通順度識別及糾正:詳細講解了內容通順度的識別方法以及糾正不通順內容的方法。內容質量:詳細講解了多種內容質量相關的算法,以及如何搭建高質量的知識問答體系的流程。標簽體系構建:詳細講解了針對內容理解的標簽體系的建設流程和方法,以及多種相關算法。文本摘要生成:詳細講解了抽取式文本摘要和生成式文本摘要兩種流行的文本摘要生成方法,以及文本摘要的常用數據集和文本摘要評價方法。文本糾錯:詳細講解了文本糾錯的傳統方法、深度學習方法、工業界解決方案,以及常用的文本糾錯工具的安裝和使用。

李明琦等 ·軟件工程 ·7.9萬字

內容理解:技術、算法與實踐
會員

這是一本在AI大模型技術背景下深入講解內容理解的技術原理、算法實現與業務實踐的著作,由騰訊的高級總監和資深內容專家領銜撰寫,全面融入了工業界在內容業務方面積累的先進技術和成熟經驗。全書圍繞內容理解、內容生成、內容質量3大關鍵領域展開,從內容產業的發展趨勢與挑戰到各種技術和算法,從行業的先進的研究成果到各種典型的應用案例,應有盡有。第一部分內容理解(第1~7章)首先,詳細介紹了內容理解的各個模塊,包括文本、圖像、語音等單模態內容的理解以及多場景文本、視頻等多模態內容的理解,幫助讀者全面了解內容理解的核心概念、技術細節和研究進展。接著,講解了多模態學習在內容理解中的應用、多模態內容理解的理論框架和大規模預訓練技術。最后,介紹了兩個主流的內容理解框架,并結合一個自研的多模態內容理解框架,闡述了解決內容理解問題的流程和具體方案。第二部分內容生成(第8~11章)詳細講解了內容生成的技術細節,結合作者團隊在業務實踐中探索的應用案例,從圖片生成、文本生成、AI素材合成到AI創作,介紹了內容創作的全棧技術,能幫助讀者由淺入深地理解內容生成的技術原理與業務實踐。第三部分內容質量(第12~14章)詳細講解了信息流產品常見的內容質量問題,比如標題黨、假新聞、低俗圖片等,介紹了如何對這些與內容質量相關的業務場景進行拆解和定義,將抽象的業務場景轉化為可以建模的問題。此外,還介紹了作者團隊采用的業務建模流程以及業界常用的解決方案和研究進展。

孫子荀等 ·軟件工程 ·18萬字

QQ閱讀手機版

主站蜘蛛池模板: 莆田市| 柘荣县| 庆城县| 桃园县| 义马市| 南京市| 柘荣县| 西昌市| 北票市| 嘉祥县| 奇台县| 江达县| 武乡县| 平顶山市| 视频| 积石山| 泰州市| 嫩江县| 慈溪市| 吉木乃县| 孝义市| 高州市| 舟山市| 秦皇岛市| 车险| 丰宁| 兰州市| 正镶白旗| 丁青县| 阳谷县| 溧阳市| 泾川县| 临湘市| 延吉市| 浮山县| 台北市| 任丘市| 始兴县| 长岭县| 义马市| 襄垣县|