1.5.7 社交網絡數據
社交網絡數據由三部分組成。第一部分是用戶個人資料,由用戶的個人屬性組成,如性別、家庭住址和年齡。這些信息通常是稀缺和不完整的,因為關心隱私的人不會填寫所有信息。這些信息可以幫助進行不同類型的推薦(如廣告)。
第二部分是社交結構,以圖的形式呈現,表示用戶之間的關系、相互依賴或互動。社交結構可以幫助我們檢測人群中的社區,理解信息在人群中的傳播,甚至預測用戶個人資料中的缺失值。
第三部分是用戶生成的社交媒體內容,如文本、照片和視頻,這些內容含有豐富的關于用戶行為/興趣的信息。當向社交媒體添加位置信息(例如Foursquare的簽到數據和帶地理標記的推文)時[63],我們可以模擬人們在城市區域內的流動性,這對于城市規劃和異常檢測是有幫助的[36]。
推薦閱讀
- 大數據技術基礎
- Python數據分析與挖掘實戰
- Voice Application Development for Android
- 數亦有道:Python數據科學指南
- 大數據治理與安全:從理論到開源實踐
- 淘寶、天貓電商數據分析與挖掘實戰(第2版)
- 標簽類目體系:面向業務的數據資產設計方法論
- 基于數據發布的隱私保護模型研究
- 產品經理數據修煉30問
- TypeScript Microservices
- Working with OpenERP
- INSTANT Windows Powershell 3.0 Windows management Instrumentation Starter
- 大數據架構師指南
- Python數據分析入門與實戰
- SQL必知必會(第四版)