- 金融科技:人工智能與機器學習卷
- 劉斌 趙云德
- 1938字
- 2019-10-11 15:00:50
金融領域中的人工智能關鍵技術
在金融領域應用中,人工智能主要包括5個關鍵技術:機器學習、生物識別、自然語言處理、語音技術以及知識圖譜,如圖2-5所示。這5種人工智能關鍵技術廣泛應用于金融領域的各個業務環節,在提高效率、降低成本、防控風險、促進普惠金融方面發揮了重要作用。

圖2-5 人工智能技術在金融領域應用的關鍵技術
來源:中國信通院《中國金融科技前沿技術發展趨勢及應用場景研究》
□ 機器學習
機器學習具有多種衍生方法,包括監督學習、無監督學習、深度學習和強化學習等。在監督學習中,算法可以使用一些包含有標簽的“訓練”數據。比如,一個交易數據集可能包含一些在欺詐和非欺詐數據點進行標注的標簽。算法就會“學會”分類的通用規則,并且可以用這些規則來對數據集中其余數據進行預測,并進行標注。無監督學習是指數據提供給算法時沒有任何標注的情況。算法會被要求去識別數據中隱藏的規律。比如,一個無監督機器學習算法會被要求去尋找一些和難以定價的非流動證券具有類似特征的證券。如果算法發現了一組非流動證券簇,那么簇中其他證券的定價模式可以用于對非流動證券進行定價。強化學習介于監督學習和無監督學習之間。在這種情況下,這種算法會被輸入無標注的數據集,為每一個數據點選擇一個行為,并獲得可以幫助算法學習的反饋(可能來自人類)。比如,強化學習可以用于機器人、博弈理論和無人駕駛汽車。深度學習是一種機器學習,根據人腦結構和功能特點設計出“層”,深度學習使用的算法就在這些“層”上發揮作用。深度學習算法,其結構也被稱為人工神經元網絡,可以用于監督學習、無監督學習或強化學習。
□ 生物識別
生物識別技術(biometrics,也稱生物測定學)是指用數理統計方法對生物進行分析,現在多指根據生物體(一般特指人)本身的生物特征來區分生物體個體的計算機技術。研究領域主要包括語音、臉、指紋、手掌紋、虹膜、視網膜、體形、個人習慣(例如敲擊鍵盤的力度和頻率、簽字)等,相應的識別技術有說話人識別、人臉識別、指紋識別、掌紋識別、虹膜識別、視網膜識別、體形識別、鍵盤敲擊識別、簽字識別等。指紋識別、人臉識別、虹膜識別和指靜脈識別是金融行業應用范圍較廣的4項生物識別技術。指紋識別技術涉及指紋樣本采集、存儲以及OCR技術,通過攝像頭提取指紋后經過指紋識別算法完成身份識別認證;人臉識別過程主要包括獲取人臉圖像、進行特征提取、根據特征進行決策分類、完成匹配識別;虹膜識別采用紅外成像技術,將虹膜紋絡特征輸入計算機,成為可供自動識別的人體身份證;指靜脈識別通過指靜脈識別儀取得個人手指靜脈分布圖,將特征值存儲,然后進行匹配,進行個人身份鑒定的技術。目前,以上生物識別技術應用于客戶身份驗證、遠程開戶、無卡取款、刷臉支付、金庫管理和網絡借貸等金融場景。
□ 自然語言處理
自然語言處理是計算機科學領域與人工智能領域中的一個重要方向。它研究能實現人與計算機之間用自然語言進行有效通信的各種理論和方法。自然語言處理在金融領域有著廣泛的應用,多數金融行業的信息為文本形式,比如新聞公告、年報、研究報告。通過用自然語言處理和知識圖譜,大大提升了獲取數據、數據清洗、深度加工的效率。目前在智能投研領域中,自然語言處理技術可對海量復雜的企業信息進行處理,以提取出行業分析人員最關注的數據指標,并進行投資分析總結,最大化減少不必要的重復人力勞動,幫助分析人員進行投資決策。在智能客服領域,可以利用自然語言處理技術讓智能客服理解客戶需求,通過與知識庫的對接為客戶解決問題。
□ 語音技術
在金融領域應用中,語音識別通常與語音合成技術結合在一起,提供一個基于語音的自然流暢的人機交互方法。語音識別整個過程包含語音信號處理、靜音切除、聲學特征提取、模式匹配等多個環節。其應用遍布各大銀行及證券公司的電話銀行、信用卡中心、委托交易、自助繳費、充值等各項業務,以及語音導航、業務咨詢、投訴申報、賬戶查詢、政策咨詢等非交易性業務中。由于金融行業帶有明顯的客戶服務屬性,加上完整而龐大的業務及數據積累,因此成為語音技術的重要應用陣地。
□ 知識圖譜
知識圖譜是通過將應用數學、圖形學、信息可視化技術、信息科學等學科的理論和方法與計量學引文分析、共現分析等方法結合,并利用可視化的圖譜形象地展示學科的核心結構、發展歷史、前沿領域以及整體知識架構以達到多學科融合目的的現代理論。知識圖譜在金融智能化的過程中發揮了無可替代的作用,可以說知識圖譜是智能金融發展的基礎。在金融行業的數據中,存在著大量的實體和關系。通過知識圖譜技術將其建立連接形成大規模的實體關系網絡,可以突破傳統的計算模式,從“實體-關系”的角度整合金融行業現有數據,結合外部數據,從而更有效地挖掘潛在客戶、預警潛在風險,幫助金融行業各項業務提升效率、發揮價值。