內(nèi)容理解:技術(shù)、算法與實踐
這是一本在AI大模型技術(shù)背景下深入講解內(nèi)容理解的技術(shù)原理、算法實現(xiàn)與業(yè)務(wù)實踐的著作,由騰訊的高級總監(jiān)和資深內(nèi)容專家領(lǐng)銜撰寫,全面融入了工業(yè)界在內(nèi)容業(yè)務(wù)方面積累的先進技術(shù)和成熟經(jīng)驗。全書圍繞內(nèi)容理解、內(nèi)容生成、內(nèi)容質(zhì)量3大關(guān)鍵領(lǐng)域展開,從內(nèi)容產(chǎn)業(yè)的發(fā)展趨勢與挑戰(zhàn)到各種技術(shù)和算法,從行業(yè)的先進的研究成果到各種典型的應(yīng)用案例,應(yīng)有盡有。第一部分內(nèi)容理解(第1~7章)首先,詳細介紹了內(nèi)容理解的各個模塊,包括文本、圖像、語音等單模態(tài)內(nèi)容的理解以及多場景文本、視頻等多模態(tài)內(nèi)容的理解,幫助讀者全面了解內(nèi)容理解的核心概念、技術(shù)細節(jié)和研究進展。接著,講解了多模態(tài)學(xué)習(xí)在內(nèi)容理解中的應(yīng)用、多模態(tài)內(nèi)容理解的理論框架和大規(guī)模預(yù)訓(xùn)練技術(shù)。最后,介紹了兩個主流的內(nèi)容理解框架,并結(jié)合一個自研的多模態(tài)內(nèi)容理解框架,闡述了解決內(nèi)容理解問題的流程和具體方案。第二部分內(nèi)容生成(第8~11章)詳細講解了內(nèi)容生成的技術(shù)細節(jié),結(jié)合作者團隊在業(yè)務(wù)實踐中探索的應(yīng)用案例,從圖片生成、文本生成、AI素材合成到AI創(chuàng)作,介紹了內(nèi)容創(chuàng)作的全棧技術(shù),能幫助讀者由淺入深地理解內(nèi)容生成的技術(shù)原理與業(yè)務(wù)實踐。第三部分內(nèi)容質(zhì)量(第12~14章)詳細講解了信息流產(chǎn)品常見的內(nèi)容質(zhì)量問題,比如標題黨、假新聞、低俗圖片等,介紹了如何對這些與內(nèi)容質(zhì)量相關(guān)的業(yè)務(wù)場景進行拆解和定義,將抽象的業(yè)務(wù)場景轉(zhuǎn)化為可以建模的問題。此外,還介紹了作者團隊采用的業(yè)務(wù)建模流程以及業(yè)界常用的解決方案和研究進展。
·18萬字