官术网_书友最值得收藏!

第二章 人工智能技術及其應用

杜寧 楊穎[1]

摘要:政策與市場驅動人工智能向大規模應用方向發展,但在這個過程中面臨安全、數據、人才、成本等各種門檻,使市場產生了一些懷疑的聲音,這些問題的解決需要政產學研各方的共同努力。從人工智能角度來說,科技創新將推動這些痛點問題的解決,并在金融領域的應用中由外圍向核心業務滲透、由感知向決策類應用擴展,推動金融行業向數字普惠化演變,引領監管科技新潮流。

關鍵詞:人工智能 遷移學習 數據安全 軟硬一體 自動機器學習

一 政策與市場環境

(一)各國加碼扶持人工智能發展

全球范圍內許多國家和地區高度重視人工智能,不斷加強頂層布局,為人工智能技術的創新應用提供了良好的政策環境。美國、歐盟、德國、英國、法國、日本等都已發布了人工智能戰略。2018年4月,英國政府公布了《產業戰略:人工智能領域行動》,就發展人工智能事宜制定了具體的實施政策。

在我國,繼2017年人工智能上升為國家戰略之后,2018年人工智能再度被寫入《政府工作報告》。2018年10月,中共中央政治局就人工智能發展現狀和趨勢舉行第九次集體學習,再次釋放出中央層面對人工智能戰略高度重視的信號。截至2018年底,超過20個省份發布了30余個人工智能專項扶持政策。

政策扶持的側重點正從技術研發轉向研發應用。2019年,我國新一代人工智能技術將加大推進力度,加快實施重大科技項目,建設一批國家級新一代人工智能創新發展試驗區。

(二)數據安全與隱私保護更加嚴苛

新一代人工智能的崛起,在給人類帶來科技革命、產業變革的同時,也引發了對安全和社會倫理道德的擔憂。國外一些互聯網巨頭嚴重數據泄露導致用戶隱私泄露的事件,引起了社會各方的關注,因此加大數據安全和隱私保護力度成為大勢所趨。2018年5月,被譽為“全世界最嚴厲的數據隱私保護法”的歐盟《通用數據保護條例》(GDPR)生效。該條例強調,機器學習模型必須具有可解釋性,而且收集用戶數據必須公開、透明,用戶可以要求經營者刪除其個人數據并且停止利用其數據進行建模。臉書和谷歌等企業成為GDPR下的第一批被告。無獨有偶,美國也通過了《2018年加州消費者隱私法案》。我國在數據安全和隱私保護方面雖然起步較晚,但也越來越重視,與人工智能密切相關的《數字安全法》《個人信息保護法》已經被列入全國人大常委會的立法規劃。

無法獲取足夠的數據就無法建模,趨于嚴格的數據安全與隱私保護對人工智能的發展來說是一個不小的挑戰。

(三)市場從盲目熱捧到趨于理性

2019年,整個人工智能行業將面臨“期中考試”,業界對人工智能的要求不再是“仰望星空”,而是要規模化落地,為社會創造價值。

然而人工智能落地的過程不是一帆風順的,阻礙人工智能行業規模化落地的門檻很多,在此我們列舉有代表性的四大類。

一是數據安全與隱私保護。數據安全與隱私保護政策的出臺是市場推動的結果,尤其是金融業涉及較多商業秘密和敏感數據的信息,在處理、共享和使用過程中面臨違規越權使用或被用于非法用途等數據泄露的安全風險,在使用人工智能時不得不對此重點考慮。

二是數據門檻。為支持人工智能應用的有效運行,需要利用包含不同維度的數據信息,即便是已有海量數據儲備的金融機構,也需要獲取多種外部數據。例如,金融機構都希望獲取大量的客戶行為數據進行精準營銷和提供以客戶為中心的服務,但由于前述數據安全與隱私保護的問題得不到解決,以及商業壟斷等原因,合法的數據供應市場發展滯后。要使數據具有分析和智能學習價值,金融機構需要加強對數據的清洗以及標簽化處理,為人工智能提供多渠道獲取信息和深度學習的數據基礎。但前期耗費的時間長、成本高,導致金融機構裹足不前,這是當前人工智能面臨的普遍困境。

三是人才門檻。在傳統機器學習的應用中,機器學習專家參與了所有階段的機器學習,然而機器學習技術的使用門檻和專家成本都很高,這對很多傳統企業尤其是中小型企業來說,很難組建這樣的團隊。以銀行為例,目前銀行軟件開發人員擁有的專業知識和技能偏向數據管理層面,而數據分析人員分布于多個業務條線,在算法方面缺少尖端人才支撐,難以對各領域龐大的數據進行有效的利用,限制了人工智能的發展和應用。

四是成本門檻。隨著人工智能應用場景的推廣與普及,機器學習更加復雜的算法要求更快的數據運算速度。由于滿足大規模高速并行運算要求的GPU(圖形處理器)、FPGA(現場可編程門陣列)等相關硬件以及模式識別和數據采集所需的各類電子傳感器的耗能水平和價格成本均較高,這就阻礙了人工智能相關技術解決方案的大規模應用和商業化。

云端部署會降低使用人工智能的成本,但對于安全隱私要求較高的金融機構來說,更傾向于部署在本地。這意味著企業要花很多錢買算力、建機房,運維成本也很高。此外,單點式解決問題、缺乏標準化流程也是企業成本高的主要原因。

由于上文所提及的各種門檻,以及商業模式、認知問題等多種原因的存在,市場對人工智能能否大規模落地出現了一些懷疑的聲音,這也是新技術發展的必然,總體來說回歸理性是大勢所趨。

人工智能的大規模落地,需要政產學研各方的共同努力。

對政府來說,可以為人工智能與產業融合營造更好的環境,如推進數據共享、提供更多應用場景、組織標準制定、加快相關立法等。

對市場來說,技術概念從提出到實際投產使用需要一段較長的時間,而業務的緊迫性又會倒逼技術快速投入應用,一些揠苗助長的行為會導致風險增大。對人工智能應用的研究需要有足夠的耐心,尊重技術發展的客觀規律。

而對技術供給方來說,也要順應市場變化,通過技術創新、產品創新、商業模式創新幫助企業降低人工智能應用門檻,腳踏實地地服務于產業發展,為社會創造價值。

二 人工智能技術的進展與趨勢

綜合第三方咨詢和研究機構的研究成果[2]以及媒體報道可以發現,近年來一些技術的進展及趨勢有望推動人工智能的大規模落地。

(一)數據安全與隱私保護

一種基于差分隱私的技術是在模型訓練里引入一些隨機信息來隱藏用戶信息,使攻擊者無法通過部分數據推斷出其他隱私信息。蘋果公司從用戶的設備收集數據時就使用了這種技術,國內瑞金醫院的一款糖尿病智能預測產品也用到了這種技術,以保護病人隱私。

聯邦學習可以理解為在一個數據聯邦內各企業無須進行數據移動或互通,而是通過某種加密機制進行參數交換,從而建立一個虛擬的共有模型,讓彼此都能獲得模型效果的提升。2017年,谷歌公司開始在安卓設備中測試聯邦學習方法。

安全多方計算是姚期智院士提出的一個概念,在整個計算協議執行過程中,各參與方對自身數據始終擁有控制權,只有計算邏輯公開。各參與方拿到計算結果后也無法推斷出原始數據。人工智能可以利用該技術在不歸集各方數據、不泄露各方隱私的前提下,通過協同計算進行算法訓練。目前該技術已經用于互聯網金融風險防控場景驗證。

邊緣計算是在靠近數據源的地方進行計算。例如,智能手機就是個人與云端的“邊緣”,相較于上傳到云端,直接在設備上處理數據,在提高效率的同時,也會降低數據泄露的風險。

此外,歐盟《通用數據保護條例》強調,機器學習模型必須具有可解釋性。可解釋性是指人(包括機器學習中的非專家)能夠理解模型在其決策過程中所做出的選擇(怎么決策、為什么決策和決策什么)。復雜的模型通常具有更好的預測性能,但隨著模型維度和復雜度的提升,模型本身的可理解性會變得越來越差,所以被視為黑盒模型。黑盒模型也意味著風險,如在金融行業預測潛在的犯罪、信用評分、欺詐發現、貸款等,模型如有偏差則影響很大,尤其不利于金融監管。目前國內可解釋模型轉換技術已經有相關專利,可以利用專利技術將復雜模型轉換為一個業務人員可以理解的簡單模型。

值得注意的是,模型具有可解釋性不僅有利于消除偏見,而且可以改進模型、提高模型效果。

(二)降低數據門檻

遷移學習是機器學習的一個分支,可以把已訓練好的模型參數遷移到新的模型中,以指導新模型訓練,更有效地學習底層規則,減少對標簽數據量的需求。例如,假設有兩個相關的場景A和B,A有大量的標簽,B僅有少量標簽或沒有標簽。遷移學習通過將A學習的結果轉移到B的建模中,以此提高B的建模效率。目前遷移學習技術已經應用于變量有限的小規模場景中,如基于傳感器網絡的定位、文字分類和圖像分類等,未來將被廣泛應用于解決更有挑戰性的問題,如視頻分類、社交網絡分析、邏輯推理等。在金融行業,目前國內遷移學習已經應用于反欺詐場景和營銷場景。

其實對于人工智能來說,需要的數據量不一定是越大越好,而應該是有利于解決業務問題、符合機器學習建模要求的數據。人工智能對數據服務的關鍵技術需求正在改變,傳統的大數據平臺將不再符合智能數據的要求,未來“數據一致性、實時性以及智能數據管理”將是面向人工智能的數據治理的趨勢。

(三)降低技術使用門檻

人工智能要解決業務問題需要一個能夠使算法與業務進行低門檻對接的中間件,將業務閉環與人工智能產生的過程融合到一起,AI PaaS(人工智能平臺即服務)應運而生。據Gartner預計,AI PaaS將在5~10年內達到高峰期[3],這種技術相當于把眾多數據科學家分析建模的能力封裝起來,幫助用戶從錯綜復雜的大量數據中抽象出各種變量因素,提煉出一套機器學習的模型,并運用在業務中。

被稱為“AI爆發必經之路”的自動機器學習技術是在無須人工智能專家介入的情況下,讓機器自動完成數據預處理、特征工程、機器學習算法選擇和配置等工作,主要面向無機器學習背景的人,這就降低了對技術人員能力的要求,被Gartner列入2019年“七大人工智能科技趨勢”。美國權威科學雜志《麻省理工科技評論》也把它評為2018年“全球十大突破性技術”,認為這將降低機器學習的使用難度和價格。在此領域,我國處于世界領先地位,國內已有科技公司早于谷歌公司發布該技術并在金融風控領域成功落地。

(四)提高算力降成本

在過去5~10年,人工智能技術得以商業化主要得益于芯片處理能力提升、云服務普及以及硬件價格下降的并行,這使計算力大幅提升。國內僅2017年一年,算力就增長了230.7%。[4]在“AICC 2018人工智能計算大會”上,浪潮集團發布了一款超級AI應用服務器,這款處理器的AI計算性能高達2000萬億次/秒,是目前全球最強大的AI計算主機之一。

人工智能芯片價格下降而尺寸縮小。據德勤預計,2020年全球芯片價格將比2014年下降70%左右。相信伴隨著算力提升的硬件單位成本的下降,企業應用人工智能的門檻將逐步降低。

算力的提升不僅涉及硬件,而且涉及軟件和硬件的“結合體”,只有了解AI算法的運算架構與邏輯,才能針對硬件去做深層次的優化,即“算法定義算力”。軟硬技術一體化趨勢正引領AI發展潮流。在這一趨勢下,AI平臺一體機、行業應用解決方案一體機等新興產品將助力傳統金融企業向智能化快速轉型。例如,一家銀行不用擴大機房規模,僅利用一體機服務器上搭載的智能營銷模型,就能提升營銷能力。對于企業來說,未來IT不再是成本中心,而將是利潤中心。

三 人工智能技術應用于金融領域的發展趨勢

(一)由外圍向核心業務滲透,由感知向決策類應用擴展

近年來,國內外較早布局人工智能的金融機構已嘗試將人工智能應用貫穿于整個業務體系。從銀行業業務的生命周期看,已經由外圍的廳堂機器人、在線客服、電話智能導航、柜面人臉識別等場景,逐漸滲透至產品開發、營銷、風險管控、客戶管理與客戶服務等核心流程。中國工商銀行早在2017年便成立了包括人工智能在內的七大創新實驗室,2018年又建立了人工智能平臺,可以實現自主構建覆蓋營銷、反欺詐、審批、貸后管理、運營等全生命周期的AI業務場景應用。

在保險行業,人工智能為前端營銷、承保、核保、理賠等核心業務流程提供多樣化支持,同時慢慢滲透至資產管理等環節。整體上看,人工智能在金融業的應用已經由早先的偏感知類向營銷、反欺詐、風控、智能投顧等偏決策類的應用場景拓展。

繼長尾信貸后,“大資管”已經成為人工智能滲透的又一領域。早在2014年,高盛就投資并開始部署一款由人工智能驅動的交易平臺用以取代證券分析師,全球規模最大的對沖基金之一Citadel已經廣泛地將機器學習技術用于量化投資策略的訓練,如高頻交易領域等。

人工智能已成為推動銀行轉型升級的主要動力。以傳統的投顧業務為例,通過人工智能技術的應用,對傳統投資理財的歷史經驗進行建模,用于客戶資產配置優化;以銀行風控合規體系建設為例,傳統的銀行風控合規體系依賴于合規、IT、人力、財務等中后臺部門較多的高重復性、低價值人工工作的支持,人工智能技術的引入可以有效替代高重復性、低復雜度的工作,這類核心業務流程中存在大量可以使人工智能應用落地的場景,而且對于銀行、保險、證券等金融機構而言具備一定的通用性。

(二)推動金融行業向數字普惠化演變

近年來,尤其是自2018年以來,國家出臺了多項服務“三農”、推動鄉村振興、精準脫貧攻堅、優化小微企業融資環境的金融政策,鼓勵普惠金融、產融結合、產業鏈金融發展,但政策落地面臨一些現實的難題。一方面,小微企業管理成本高、業務效率低;另一方面,也是最為關鍵的,小微企業無法滿足傳統金融機構風險管理的要求,導致金融機構的金融服務無法惠及這些群體。

通過人工智能構建基于企業運營場景數據驅動的金融服務,為解決中小微企業“融資難、融資貴、持續發展”等問題提供了一條創新路徑。

以智能供應鏈金融(見圖2-1)為例,在依托供應鏈核心企業信用的基礎上,實時掌握中小微企業的交易信息、訂單信息及物流信息,通過系統和交易流程的設計嚴格管控其資金流,從而突破傳統的對企業靜態基礎信息授信,轉向對中小微企業真實優質的業務及交易授信。例如,中關村銀行的AI供應鏈金融平臺能夠對供業鏈數據、企業數據、市場數據以及銀行數據進行深度分析與實時計算監測,使銀行及時獲取企業資金需求,并精準認知企業經營能力與風險狀態。

圖2-1 智能供應鏈金融平臺

通過人工智能分析,可以快速建立多維度的授信準入規則及依據訂單分析預測的動態授信額度,企業準入后自動納入實時貸中風控及智能貸后管理系統,實現中小微企業從前到后全流程的供應鏈內金融信貸智能管理。同時,基于企業數據結合企業業務發展訴求,為企業輸出人工智能技術和應用能力,促進企業創新發展和轉型升級。

人工智能的發展將促使金融行業的服務模式在未來發生巨大變化,觸及更多尚未覆蓋的群體,同時還可以降低金融機構的服務與運營成本,讓客戶獲得更加優質且成本低廉的產品與服務,最終實現數字化普惠金融。

(三)人工智能引領監管科技潮流

監管科技是與金融監管、合規與風控相關的各種信息技術及其應用,既包括運用新技術提高對傳統金融業的監管(合規)效率、降低監管(合規)成本,也包括運用新技術監管新業態(如互聯網金融等)。

黨中央、國務院高度重視“防范化解金融風險”,當前金融機構面臨的風險正以隱蔽性、波動性和挑戰性的特點展現,因此監管科技是未來金融科技發展的主要方向。在監管科技方面,人工智能的應用場景包括反洗錢、交易反欺詐、申請反欺詐、智能催收、智能進件審核、申請信用評分、逾期預警、差異化催收等業務全流程的風控和反欺詐場景。

1.反洗錢

從中國人民銀行破獲的洗錢案件情況來看,我國洗錢犯罪活動呈現“向不發達區域蔓延,涉眾案件、職務犯罪案件增多,洗錢手段不斷翻新”的新趨勢。這些趨勢為反洗錢工作帶來了新的挑戰。面對嚴峻的反洗錢形勢,反洗錢監管工作愈加急迫和嚴格。

目前銀行反洗錢工作的開展主要依賴反洗錢專家的經驗規則。隨著銀行交易量的逐年增長,僅通過人工規則優化來減少可疑案件量,難以建立規則優化的長效機制。如何解決快速增長的交易量導致的案件激增和人力資源有限之間的矛盾,更準確、更高效地識別反洗錢可疑交易,成為各大銀行急需解決的問題。

銀行等金融機構預防、監控洗錢活動,以客戶識別、大額交易和可疑交易報告以及記錄保存等制度為核心內容,通過資金監測實現反洗錢工作目標。具體工作內容包括建立健全客戶身份識別制度、客戶身份資料和交易記錄保存、大額交易識別和生成可疑交易報告等。

人工智能可以為金融機構的法律合規部門、反洗錢部門提供由人工智能機器學習算法驅動的反洗錢決策支持。結合金融機構現有的基于規則的反洗錢系統,為反洗錢業務部門提供案宗可疑率精準打分,再通過機器學習模型和模型可解釋分析對可疑率打分模型進行一定的特征解釋,支撐反洗錢案件的報告流程,從而解決案件激增和人力資源有限的矛盾。

從長期來看,模型不斷迭代優化,其特征的提煉也可以反哺反洗錢規則庫,迭代優化反洗錢規則體系,從而實現知識積累,并實現反洗錢審核閉環優化體系。

2.反欺詐

目前金融機構面臨惡意欺詐、過度消費、重復授信等亂象,欺詐手段越來越專業化、產業化、隱蔽化、場景化。傳統手段主要依靠人,人往往采取“抓大放小”的方式總結規則,難以覆蓋長尾欺詐場景和手段,難以準確掌握新型欺詐手段的特征與規則,難以及時快速地洞察新型欺詐手段以應對欺詐行為的持續變化。因此,未來的趨勢靠專家規則能捕獲的欺詐極少。

人工智能可以實現端到端地解決各類欺詐和信用風險問題。通過專家規則和機器學習模型地恰當結合,能夠實現各個業務流程中的智能風控并做出反欺詐決策。利用閉環的自學習機制和超高維的模型,及時調整以適應業務變化和欺詐手段變化,使客戶從傳統風控走向深度應用人工智能的智能風控。

參考文獻

艾瑞咨詢:《2018年中國人工智能行業研究報告》,2018。

德勤咨詢:《中國人工智能產業白皮書》,2018。

杜寧、王志峰、沈筱彥、孟慶順等:《監管科技:人工智能與區塊鏈應用之大道》,中國金融出版社,2018。

宋占軍:《AI在銀行業的應用難點及破解之道》,《金融電子化》2017年第9期。

《預測2019:AI與未來工作》,https://blog.csdn.net/cf2suds8x8f0v/article/details/85043092。

CB Insights,“Artificial Intelligence Trends 2019”,2019.

“10 Breakthrough Technologies 2018”,https://www.technologyreview.com/lists/technologies/2018/.


[1] 杜寧,高級工程師,第四范式(北京)技術有限公司執行副總裁,中國互聯網金融協會金融科技專業委員會副主任委員,中關村互聯網金融研究院副理事長。楊穎,第四范式(北京)技術有限公司戰略研究高級經理。

[2] 如《麻省理工科技評論》《2018年“全球十大突破性技術”》《預測2019:AI與未來工作》《2019年人工智能趨勢報告》。

[3] Gartner:《2018年新興技術成熟度曲線》,2018。

[4] 浪潮集團、IDC:《2018中國AI計算力發展報告》,2018。

主站蜘蛛池模板: 乌兰察布市| 菏泽市| 曲麻莱县| 甘南县| 湖南省| 卢氏县| 金坛市| 巴彦淖尔市| 于田县| 洛扎县| 罗源县| 淅川县| 榆中县| 石家庄市| 铜川市| 门源| 合江县| 东辽县| 襄汾县| 施秉县| 且末县| 台安县| 嵊泗县| 岑巩县| 册亨县| 潼关县| 连江县| 阳朔县| 东乌珠穆沁旗| 禹城市| 广丰县| 金塔县| 同仁县| 南木林县| 达拉特旗| 富顺县| 东阿县| 安仁县| 呼和浩特市| 宿迁市| 昂仁县|