官术网_书友最值得收藏!

內容理解:技術、算法與實踐
會員

這是一本在AI大模型技術背景下深入講解內容理解的技術原理、算法實現與業務實踐的著作,由騰訊的高級總監和資深內容專家領銜撰寫,全面融入了工業界在內容業務方面積累的先進技術和成熟經驗。全書圍繞內容理解、內容生成、內容質量3大關鍵領域展開,從內容產業的發展趨勢與挑戰到各種技術和算法,從行業的先進的研究成果到各種典型的應用案例,應有盡有。第一部分內容理解(第1~7章)首先,詳細介紹了內容理解的各個模塊,包括文本、圖像、語音等單模態內容的理解以及多場景文本、視頻等多模態內容的理解,幫助讀者全面了解內容理解的核心概念、技術細節和研究進展。接著,講解了多模態學習在內容理解中的應用、多模態內容理解的理論框架和大規模預訓練技術。最后,介紹了兩個主流的內容理解框架,并結合一個自研的多模態內容理解框架,闡述了解決內容理解問題的流程和具體方案。第二部分內容生成(第8~11章)詳細講解了內容生成的技術細節,結合作者團隊在業務實踐中探索的應用案例,從圖片生成、文本生成、AI素材合成到AI創作,介紹了內容創作的全棧技術,能幫助讀者由淺入深地理解內容生成的技術原理與業務實踐。第三部分內容質量(第12~14章)詳細講解了信息流產品常見的內容質量問題,比如標題黨、假新聞、低俗圖片等,介紹了如何對這些與內容質量相關的業務場景進行拆解和定義,將抽象的業務場景轉化為可以建模的問題。此外,還介紹了作者團隊采用的業務建模流程以及業界常用的解決方案和研究進展。

孫子荀等 ·軟件工程 ·18萬字

基于NLP的內容理解
會員

這是一本講述如何用NLP技術進行文本內容理解的著作,也是一本系統講解NLP算法的著作,是作者在NLP和內容理解領域多年經驗的總結。本書結合內容理解的實際業務場景,系統全面、循序漸進地講解了各種NLP算法以及如何用這些算法高效地解決內容理解方面的難題,主要包括如下幾個方面的內容:文本特征表示:文本特征表示是NLP的基石,也是內容理解的基礎環節,本書詳細講解了離散型表示方法和分布型表示方法等特征表示方法及其應用場景,還講解了詞向量的評判標準。內容重復理解:詳細講解了標題重復、段落重復、文章重復的識別方法和去重算法。內容通順度識別及糾正:詳細講解了內容通順度的識別方法以及糾正不通順內容的方法。內容質量:詳細講解了多種內容質量相關的算法,以及如何搭建高質量的知識問答體系的流程。標簽體系構建:詳細講解了針對內容理解的標簽體系的建設流程和方法,以及多種相關算法。文本摘要生成:詳細講解了抽取式文本摘要和生成式文本摘要兩種流行的文本摘要生成方法,以及文本摘要的常用數據集和文本摘要評價方法。文本糾錯:詳細講解了文本糾錯的傳統方法、深度學習方法、工業界解決方案,以及常用的文本糾錯工具的安裝和使用。

李明琦等 ·軟件工程 ·7.9萬字

前端工程質量保障體系實踐
會員

本書從前端開發的完整生命周期角度進行講解,幫助讀者了解前端的工程搭建、版本控制、代碼質量、組件建設、測試保障、持續集成、系統部署、頁面監控、請求監控、資源保障,以及工程質量優化的相關手段。讀完本書,讀者可以清楚地了解在不同的階段有哪些保障工程質量的措施。本書第1章介紹前端的發展歷史,講述前端如何從后端中獨立出來,并逐步走向工程化。第2章講解在前端項目啟動前需要做的準備工作。第3章介紹如何規范使用Git進行版本控制,從而有效提高多人協作的開發效率。第4章系統地介紹對代碼質量進行工程化管理的方法。第5章從組件規范、目錄結構、樣式主題、國際化、組件測試、文檔管理、構建打包及發布規范8個方面介紹高質量的組件是如何建設的。第6章介紹前端工程中測試環節涉及的內容。第7章介紹持續集成中保障質量的手段。第8章主要介紹如何部署穩定、高效的系統。第9章介紹性能監控、異常監控、白屏監控、卡頓監控及用戶行為監控等常用的頁面監控手段。第10章講解請求監控的常用手段與識別以及防御爬蟲的方法。第11章介紹資源保障的必要性和通用手段。第12章講解webpack在打包構建中常用的優化手段。

曾靜益 ·軟件工程 ·11.7萬字

QQ閱讀手機版

主站蜘蛛池模板: 治县。| 晋州市| 罗江县| 玛沁县| 自贡市| 双柏县| 淮北市| 德惠市| 建始县| 五原县| 建宁县| 尼木县| 广宗县| 巴塘县| 诸城市| 尤溪县| 大安市| 铜山县| 北碚区| 北碚区| 灵宝市| 招远市| 温州市| 龙南县| 宣恩县| 丰镇市| 收藏| 南涧| 孟州市| 城市| 高雄县| 阿坝县| 淮滨县| 阜平县| 威远县| 焦作市| 九龙县| 河曲县| 玛曲县| 深圳市| 枣阳市|