- 金融中的機器學習
- (英)簡尼斯·克拉斯
- 1336字
- 2021-07-09 10:34:13
本書內容概要
第1章“神經網絡和基于梯度的優化”討論機器學習包括哪些類別,以及在金融的不同細分領域中使用它們的背后動機。我們將學習神經網絡的工作原理,并從頭構建一個神經網絡模型。
第2章“機器學習在結構化數據中的應用”處理諸如關系型數據庫中具有固定字段的數據。我們將體驗模型的創建過程:從一個啟發式模型,到簡單的基于特征工程的模型,再到完全基于學習的模型。另外,我們將學習如何使用scikit-learn來評估模型,如何訓練基于樹狀的模型(如隨機森林),以及如何使用Keras來構建神經網絡模型。
第3章“計算機視覺的應用”講述了計算機視覺讓我們按照比例解釋和觀察現實世界的過程。在這一章中,我們將學習讓計算機視覺識別圖像內容的技術,還將學習卷積神經網絡和Keras模塊,并使用這些模塊來設計和訓練前沿的計算機視覺模型。
第4章“理解時間序列”討論分析時間相關的數據所需的大部分工具。在這一章中,我們首先討論產業界專業人士用于建模時間序列的精選工具,并講述如何用Python高效地使用這些工具。我們將學習現代機器學習算法是如何在時間序列中挖掘各類模式的,并討論如何通過傳統技術來輔助補充現代機器學習技術。
第5章“用自然語言處理解析文本數據”討論如何使用spaCy庫和大量的新聞數據來讓諸如命名實體識別和情感分析等常見任務可以快速高效地執行。我們將學習如何使用Keras庫來創建定制化的語言模型。本章還介紹Keras函數式應用程序編程接口(Application Pragramming Interface,API),函數式API可以讓我們構建更加復雜的模型(如不同語言之間的翻譯模型)。
第6章“生成模型的應用”講述了使用生成模型來生成數據。當我們沒有充足的數據或希望通過模型觀察數據并分析數據時,可以使用生成模型來生成數據。在這一章中,我們將學習(變分)自編碼器和生成式對抗模型。我們將學習使用t-SNE算法來合理使用上述工具,使用它們來解決傳統問題(如信用卡詐騙檢測)。我們將通過機器學習來輔助人類的打標簽操作,進而提高數據收集和打標簽的效率。最后,使用主動學習來收集有用的數據并大大減少需要的數據量。
第7章“金融市場中的強化學習”討論了強化學習。強化學習不需要人類打標簽,可以“正確”地訓練數據。本章討論和實現幾個強化學習算法,從Q-learning到A2C(Advantage Actor-Critic)算法。我們將討論背后的理論、與經濟領域的關聯,并在實際的案例中了解強化學習如何直接用于挖掘組合的形成。
第8章“調試和發布產品”解決了在構建和出品復雜模型過程中可能遇到的各種問題。我們將討論如何調試和測試數據,在訓練模型過程中保持對數據隱私的敏感性,如何為訓練準備數據,并且分析為什么模型會如此預測。我們將學習自動化調節模型超參,學習使用學習速率來減少過擬合,學習診斷和避免梯度消失和梯度爆炸問題。本章還解釋了如何去監控和理解生產中的指標,并討論如何提升建模速度。
第9章“挑戰偏見”討論了機器學習模型可能學習不公平的策略。本章強調了幾種強化模型公平性的方法,包括中樞學習(pivot learning)和因果學習(causal learning)。本章展示如何檢查模型和挖掘偏見。最后討論模型所在的復雜系統中的不公平如何導致系統失敗,并給出了檢查清單來幫助模型減少偏見。
第10章“貝葉斯推理和概率編程”使用PyMC3來討論使用概率編程的理論優勢和實際優勢。我們實現了一個采樣器,來從數值角度理解貝葉斯理論,最后學習如何推斷股票價格波動的分布。