- 情感分析進階
- 林政 劉正宵 李江楠
- 910字
- 2023-08-28 18:18:02
前言
文本情感分析是自然語言處理、人工智能與認知科學等領域的重要研究方向之一。通過計算機自動進行文本情感分析的研究始于20世紀90年代,早期研究以文本情感分類為主,即把文本按照主觀傾向性分成正面、負面和中性三類。其中正面類別是指文本體現出支持的、積極的、喜歡的態度和立場,負面類別是指文本體現出反對的、消極的、厭惡的態度和立場,中性類別是指沒有偏向的態度和立場。隨著互聯網的飛速發展,人們越來越習慣于在社交網絡上發表主觀性言論。社交網絡中的大量用戶生成數據為情感分析提供了新的機遇,同時也帶來了新的挑戰。
從內容的角度看,很多言論所蘊含的情感是隱式的,而機器很難從表面文字推理言外之意;從用戶的角度看,每個人的性格不同導致情感表達的方式也不同,所以要考慮用戶特征進行個性化情感分析,不能一概而論;從語料的角度看,對于低資源領域或者任務,已有的數據驅動模型難以取得令人滿意的效果;從魯棒性和安全性的角度看,現有的深度學習模型很容易受到不易覺察的對抗攻擊,從而產生錯誤的情感預測。因此,傳統的文本情感分析方法已經難以滿足復雜網絡數據的分析需求。此外,隨著個性化推薦、用戶畫像分析、對話機器人等新技術和新應用的興起,相關的情感分析技術也需要不斷升級,從而提供更加智能化、更加人性化、更加共情的情感分析服務。
本書針對以上挑戰,全面系統地介紹高級文本情感分析的核心技術與應用實踐。本書包括五個部分:第一部分介紹文本情感分析的研究背景、研究現狀和基礎技術;第二部分從內容語義理解的角度出發,介紹基于隱式表達的諷刺檢測技術;第三部分從用戶個性化建模的角度出發,介紹多輪對話中的情緒分析技術;第四部分介紹小樣本場景下的立場檢測解決方案;第五部分介紹對抗攻擊場景下的情感分類防御技術。
本書可以為人工智能、機器學習、自然語言處理和社會計算等領域的從業者和科研人員提供一些前沿視野及相關理論、方法和技術,如基于隱式表達的諷刺檢測、面向個性化的多輪對話情緒分析、小樣本場景下的立場檢測等,也可作為相關專業高年級本科生或研究生的參考教材。
由于作者水平有限,因此盡管盡了最大的努力,但書中依然難免存在疏漏和錯誤之處,敬請廣大專家、讀者批評指正。
作者
2023年1月