內容理解:技術、算法與實踐
這是一本在AI大模型技術背景下深入講解內容理解的技術原理、算法實現與業務實踐的著作,由騰訊的高級總監和資深內容專家領銜撰寫,全面融入了工業界在內容業務方面積累的先進技術和成熟經驗。全書圍繞內容理解、內容生成、內容質量3大關鍵領域展開,從內容產業的發展趨勢與挑戰到各種技術和算法,從行業的先進的研究成果到各種典型的應用案例,應有盡有。第一部分內容理解(第1~7章)首先,詳細介紹了內容理解的各個模塊,包括文本、圖像、語音等單模態內容的理解以及多場景文本、視頻等多模態內容的理解,幫助讀者全面了解內容理解的核心概念、技術細節和研究進展。接著,講解了多模態學習在內容理解中的應用、多模態內容理解的理論框架和大規模預訓練技術。最后,介紹了兩個主流的內容理解框架,并結合一個自研的多模態內容理解框架,闡述了解決內容理解問題的流程和具體方案。第二部分內容生成(第8~11章)詳細講解了內容生成的技術細節,結合作者團隊在業務實踐中探索的應用案例,從圖片生成、文本生成、AI素材合成到AI創作,介紹了內容創作的全棧技術,能幫助讀者由淺入深地理解內容生成的技術原理與業務實踐。第三部分內容質量(第12~14章)詳細講解了信息流產品常見的內容質量問題,比如標題黨、假新聞、低俗圖片等,介紹了如何對這些與內容質量相關的業務場景進行拆解和定義,將抽象的業務場景轉化為可以建模的問題。此外,還介紹了作者團隊采用的業務建模流程以及業界常用的解決方案和研究進展。
·18萬字