cq9电子游戏系统

機器學習主要有三大類別：監督學習（Supervised Learning）、無監督學習（Unsupervised Learning）、增強學習（Reinforcement Learning），下面對這三大類別進行簡要介紹。

1.監督學習

監督學習是機器學習中應用最廣泛也最可靠的技術。簡單來說，監督學習的目的就是通過標注好的數據進行模型訓練，從而期望利用訓練好的模型對新的數據進行預測或分類。在這里，“監督”（Supervised）這個詞意味著我們已經有標注好的已知數據集。

監督學習的應用場景非常廣泛，常見的垃圾郵件過濾、房價預測、圖片分類等都是適合它的領域，但其最大弱點就是需要大量標注數據，前期投入成本極高。

2.無監督學習

相對于需要大量標注數據的監督學習，無監督學習無須標注數據就能達到某個目標。注意，并不是所有場景都適合采用無監督學習，無監督學習經常被用于以下兩方面。

◎　聚類（Clustering）：在聚類場景下使用無監督學習的頻率可能是最高的。例如給出一堆圖片，把相似的圖片劃分在一起。我們既可以預設一個類別總數進行自動劃分（即半監督學習，Semi-supervised）；也可以預設一個差異閾值，然后對所有圖片進行自動聚類。

◎　降維（Dimensionality Reduction）：在數據特征過多、維度過高時，我們通常需要把高維數據降到合理的低維空間處理，并期望保留最重要的特征數據。主成分分析（Principal Component Analysis，PCA）就是其中最為常見的算法應用。

3.增強學習

無論是監督學習還是無監督學習，其訓練基礎都來源于數據本身。而增強學習最大的特點就是需要與環境有某種互動關系，這也促使人們在增強學習的研究中利用類似電子游戲的環境來模擬互動并進行AI訓練。例如，DeepMind在2015年提出的利用DQN學習ATARI游戲的操作，以及OpenAI的Gym等。

增強學習的實現和應用場景比較特殊，盡管某些大型公司已經在推薦系統、動態定價等場景中嘗試應用增強學習，但仍只限于實驗性質，有興趣的讀者可以自行閱讀其他資料進行學習，在本書中不對增強學習進行講解。

官术网_书友最值得收藏!