- 眾包平臺中的欺詐檢測與風險預警
- 張文潔等
- 8字
- 2024-05-23 14:58:52
1.4 研究內容與方法
1.4.1 研究內容
在充分分析相關文獻的基礎上,基于傳統的欺詐理論,本書首先試圖針對以知識成果為導向的眾包競賽環境中的欺詐行為,利用多種機器學習方法進行對比分析,著重深入探討各類型檢測線索的有效性與價值。其次,由于數據來源包括平臺文本數據、用戶信息與行為數據、用戶關系網絡數據,涉及結構化與非結構化數據信息的量化,本書試圖利用自然語言處理技術與量化方法,從平臺的結構化與非結構化數據信息中提取語言與非語言線索,即一元特征,并利用社會網絡分析方法從用戶關系網絡中提取社會網絡指標,即二元特征。最后,本書以流程視角的輸入-處理-輸出(I-P-O)階段劃分為基本框架,根據各類型特征生成的時間順序特點,選擇表現最優的機器學習分類器構建一個智能化欺詐檢測系統。總而言之,本書主要包括以下3個方面的內容:①眾包競賽發起方欺詐自動化檢測中動靜態環境下的語言與非語言特征的價值探索;②基于流程視角的分階段眾包發起方欺詐檢測實時預警模型與框架設計;③社會網絡分析在眾包發起方欺詐檢測中的有效性探尋。從結構上看,本書分6章展開,具體研究內容如下:
第1章,緒論。本章主要對本書的研究背景、研究問題、研究意義、研究內容與方法以及主要創新點進行了闡述。
第2章,文獻綜述。本章首先對眾包與眾包競賽模式的相關研究進行了綜述;其次介紹了線上欺詐檢測的研究領域與方法;最后介紹了社會網絡分析及其在欺詐檢測領域的相關應用。本章為構建基于機器學習的線上欺詐預警實時檢測框架提供了強有力的支持和論證。
第3章,動靜態環境下的語言與非語言線索在眾包發起方欺詐檢測中的價值探索。眾包作為一個線上平臺,基于4種欺詐理論及其在線上環境的擴展應用,為探索4種類型的欺詐檢測線索提供了一個完整的環境。本書所研究的眾包平臺上的在線信息包含4個維度,即靜態語言信息、動態語言信息、靜態非語言信息和動態非語言信息。本章利用自然語言處理技術與Python工具,從上述結構化與非結構化數據信息中提取4類欺詐檢測線索,從而探索動靜態環境下的語言與非語言線索在眾包競賽發起方欺詐自動化檢測中的價值。
第4章,基于流程視角的眾包發起方欺詐防控與預警。本章從流程視角來檢測眾包發起方的欺詐行為,重點研究眾包競賽不同階段的輸入-處理-輸出(I-P-O)模型,并構建了一個智能化欺詐檢測框架,通過對眾包競賽項目的自動跟蹤和監控,實現了對風險因素的全程控制和預警。
第5章,基于社會網絡分析的眾包發起方欺詐檢測。本章引入社會網絡分析方法,分析了具有欺詐行為的發起方的內在結構和特征,并探究了如何利用社會網絡的幾個關鍵概念,即中心性、凝聚性和結構等價性有效地檢測出潛在的惡意發起方。同時,本章研究首次嘗試把社會網絡分析的信息作為眾包欺詐檢測來源,將通過檢驗的特征加入上述智能模型,進一步提升預測效率。
第6章,研究結論與展望。本章對全書內容進行了總結,對研究中存在的不足進行了分析和反思,對于未來可能進行的線上欺詐檢測與眾包風險防控研究進行了展望。