- 機(jī)器學(xué)習(xí)從入門(mén)到入職:用sklearn與keras搭建人工智能模型
- 張威
- 2917字
- 2020-05-22 17:14:07
前言
為什么要寫(xiě)本書(shū)
人工智能是目前比較火熱的概念,存在諸多觀點(diǎn)。例如,有人認(rèn)為人工智能系統(tǒng)的智能水平即將全面超越人類(lèi)的水平,甚至在不久的將來(lái),超級(jí)人工智能(“天網(wǎng)”“終結(jié)者”)將會(huì)出現(xiàn),人類(lèi)將會(huì)被消滅或者奴役;也有人認(rèn)為人工智能只是一個(gè)炒作概念,因?yàn)槿斯ぶ悄艿南嚓P(guān)理論在20世紀(jì)六七十年代就引發(fā)過(guò)一波熱潮,但是在之后的若干年中,由于互聯(lián)網(wǎng)革命,人工智能的熱度逐漸消退,而如今熱潮再起,只不過(guò)是老調(diào)重彈。
上述觀點(diǎn)都有失偏頗,人工智能在某些特定領(lǐng)域具有良好的表現(xiàn):AlphaGo在對(duì)陣柯潔時(shí)以巨大優(yōu)勢(shì)獲勝;在特定醫(yī)療影像處理上,無(wú)論處理速度還是診斷的準(zhǔn)確度,人工智能都完勝經(jīng)驗(yàn)豐富的醫(yī)師;人臉識(shí)別現(xiàn)在不僅可以對(duì)近期人臉進(jìn)行判斷,還可以根據(jù)以往面貌特征推斷將來(lái)的面貌,并且在失蹤人口的搜索上已經(jīng)出現(xiàn)了成功案例。從上述例子來(lái)看,人工智能似乎在不久的將來(lái)會(huì)統(tǒng)治人類(lèi),其實(shí)不然,針對(duì)上述應(yīng)用場(chǎng)景的人工智能通常被稱(chēng)為專(zhuān)用人工智能,是局限于某個(gè)特定任務(wù)(任務(wù)單一、需求明確、應(yīng)用邊界清晰、領(lǐng)域知識(shí)豐富、建模相對(duì)簡(jiǎn)單)進(jìn)行的專(zhuān)門(mén)應(yīng)用。總的來(lái)說(shuō),人工智能的應(yīng)用現(xiàn)如今局限于專(zhuān)用性,遠(yuǎn)遠(yuǎn)沒(méi)有達(dá)到諸如“終結(jié)者”這種具有通用性任務(wù)能力的程度。
人工智能總體發(fā)展水平仍處于起步階段——通用人工智能領(lǐng)域的研究與應(yīng)用仍然任重道遠(yuǎn),對(duì)超級(jí)人工智能(“天網(wǎng)”“終結(jié)者”)的擔(dān)憂(yōu)大可不必,因?yàn)槌?jí)人工智能本質(zhì)上是通用人工智能的高級(jí)形式,而通用人工智能尚處于起步階段。例如,人腦是一個(gè)通用的智能系統(tǒng),能夠歸納與推理,具有諸多感官信息,可以處理視覺(jué)、聽(tīng)覺(jué)、判斷、推理、學(xué)習(xí)、思考、規(guī)劃、設(shè)計(jì)等各類(lèi)問(wèn)題。當(dāng)前的人工智能系統(tǒng)在信息感知、機(jī)器學(xué)習(xí)等“淺層智能”方面進(jìn)步顯著,但是在概念抽象和推理決策等“深層智能”方面的能力還很薄弱。
人工智能的熱潮是否是另外一個(gè)炒作概念?為什么20世紀(jì)六七十年代出現(xiàn)的學(xué)科到現(xiàn)在又被炒作了一番?其實(shí)任何一項(xiàng)技術(shù)都要經(jīng)歷以下幾個(gè)階段:一是理論的提出,理論的產(chǎn)生奠定整個(gè)學(xué)科的框架,由此衍生出3個(gè)學(xué)派,即符號(hào)主義、連接主義及行為主義;二是理論的實(shí)驗(yàn)室應(yīng)用或者小規(guī)模應(yīng)用,主要解決理論落地的問(wèn)題,這些應(yīng)用通常與大規(guī)模商業(yè)應(yīng)用有一步之遙,之所以沒(méi)有投入大規(guī)模商業(yè)應(yīng)用主要是由于生態(tài)的限制;三是大規(guī)模的商業(yè)應(yīng)用,該階段已經(jīng)具備一定的技術(shù)及商業(yè)生態(tài),如互聯(lián)網(wǎng)技術(shù)的誕生比計(jì)算機(jī)技術(shù)晚,但互聯(lián)網(wǎng)革命爆發(fā)于20世紀(jì)90年代中后期,這是因?yàn)樽畛跤?jì)算機(jī)占地面積較大,且算力較低,而價(jià)格又使大部分家庭難以負(fù)擔(dān),隨著計(jì)算機(jī)的普及,以及計(jì)算機(jī)系統(tǒng)使用的簡(jiǎn)易化等諸多合力,互聯(lián)網(wǎng)革命開(kāi)始興起。同樣的發(fā)展邏輯也出現(xiàn)在移動(dòng)互聯(lián)網(wǎng)上,并且人工智能的發(fā)展也適用于該邏輯。
人工智能在20世紀(jì)的發(fā)展比較緩慢主要是因?yàn)橄嚓P(guān)的生態(tài)并沒(méi)有很完善地建立起來(lái),而現(xiàn)在已經(jīng)截然不同。
成為人工智能的參與者是一個(gè)不錯(cuò)的想法。對(duì)大多數(shù)人來(lái)說(shuō),人工智能的印象源自科幻電影。像先知或者智囊團(tuán)一樣的計(jì)算機(jī),或者像忍者一樣靈活運(yùn)動(dòng)的機(jī)器人,充滿(mǎn)了神秘;同樣,掌握人工智能也并不是一件容易的事情,首先它是多門(mén)學(xué)科的綜合,既各有體系,又相互交融,而相關(guān)的理論也日新月異,初學(xué)者在這多如牛毛的資料中容易迷失,最終只能“從入門(mén)到放棄”。
本書(shū)主要從以下幾個(gè)方面使讀者向“從入門(mén)到入職”的目標(biāo)逐步靠近。
·從知識(shí)體系及算法原理上盡可能全面而翔實(shí)地進(jìn)行介紹,使讀者能夠形成完整的知識(shí)架構(gòu),同時(shí)對(duì)相關(guān)算法的底層邏輯有清晰的了解。
·對(duì)基于成熟的機(jī)器學(xué)習(xí)框架(Sklearn、Keras)的使用方法進(jìn)行講解,避免讀者在學(xué)習(xí)過(guò)程中重復(fù)“造輪子”,使其在閱讀完本書(shū)之后可以擁有基本的模型開(kāi)發(fā)能力。
·從職業(yè)的角度,首先對(duì)工作中實(shí)際模型開(kāi)發(fā)流程的4個(gè)步驟進(jìn)行詳細(xì)介紹,并搭配相應(yīng)的代碼講解,而不是局限于模型的實(shí)現(xiàn);然后對(duì)目前人工智能崗位做出了詳細(xì)的分析,使讀者在求職過(guò)程中能夠精確地匹配自己的能力和有意愿擔(dān)任的職位,并且給出了具有參考意義的進(jìn)階之路。
如何閱讀本書(shū)
本書(shū)包括13章,可分為4個(gè)部分:第1章至第3章主要介紹機(jī)器學(xué)習(xí)的概念、開(kāi)發(fā)環(huán)境的搭建及模型開(kāi)發(fā)的基本流程等;第4章至第7章涵蓋回歸、分類(lèi)、聚類(lèi)、降維的實(shí)現(xiàn)原理,以及機(jī)器學(xué)習(xí)框架Sklearn的具體實(shí)現(xiàn)與應(yīng)用;第8章至第12章主要闡述深度學(xué)習(xí),如卷積神經(jīng)網(wǎng)絡(luò)、生成性對(duì)抗網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)原理,以及深度學(xué)習(xí)框架Keras的具體實(shí)現(xiàn)與應(yīng)用;第13章簡(jiǎn)單介紹機(jī)器學(xué)習(xí)崗位的入職技巧。
第一部分
第1章:機(jī)器學(xué)習(xí)概述,主要介紹機(jī)器學(xué)習(xí)的概念、發(fā)展歷程及趨勢(shì)。
第2章:機(jī)器學(xué)習(xí)的準(zhǔn)備工作,主要介紹機(jī)器學(xué)習(xí)的知識(shí)準(zhǔn)備和環(huán)境準(zhǔn)備步驟,以及機(jī)器學(xué)習(xí)模型開(kāi)發(fā)的工作流程。
第3章:Sklearn概述,主要介紹Sklearn的環(huán)境搭建與安裝,以及Sklearn常用類(lèi)及其結(jié)構(gòu)。
第二部分
第4章:Sklearn之?dāng)?shù)據(jù)預(yù)處理,主要介紹常用的數(shù)據(jù)預(yù)處理方法,如缺失值處理、數(shù)據(jù)的規(guī)范化、非線(xiàn)性變換、自定義預(yù)處理及非結(jié)構(gòu)性數(shù)據(jù)預(yù)處理等。
第5章:Sklearn之建立模型(上),主要介紹監(jiān)督學(xué)習(xí)的概念及相關(guān)的監(jiān)督學(xué)習(xí)模型,如線(xiàn)性回歸、廣義線(xiàn)性模型、穩(wěn)健回歸、支持向量機(jī)、高斯過(guò)程、梯度下降、決策樹(shù)及分類(lèi)等算法原理。
第6章:Sklearn之建立模型(下),主要介紹無(wú)監(jiān)督學(xué)習(xí)的概念及相關(guān)的無(wú)監(jiān)督學(xué)習(xí)模型,主要包括聚類(lèi)和降維。聚類(lèi)方法包括K-mean聚類(lèi)、均值偏移聚類(lèi)、DBSCAN聚類(lèi)等;降維方法包括主成因分析、隱含狄利克雷分布、流形學(xué)習(xí)等。
第7章:Sklearn之模型優(yōu)化,模型優(yōu)化有很多種方法,有針對(duì)數(shù)據(jù)本身的優(yōu)化,如一些采樣方法;有針對(duì)模型本身的優(yōu)化,如超參數(shù)調(diào)整;還有一些集成學(xué)習(xí)方法,用于提高模型的健壯性及表現(xiàn)能力。
第三部分
第8章:Keras主要API及架構(gòu)介紹,主要闡述Keras的環(huán)境搭建與安裝,以及Keras的架構(gòu)、API與模型形式。
第9章:一個(gè)神經(jīng)網(wǎng)絡(luò)的迭代優(yōu)化,主要介紹神經(jīng)網(wǎng)絡(luò)的組成、結(jié)構(gòu)、學(xué)習(xí)機(jī)制,以及通用的調(diào)優(yōu)方法。
第10章:卷積神經(jīng)網(wǎng)絡(luò),主要介紹卷積神經(jīng)網(wǎng)絡(luò)的重要組件及其實(shí)現(xiàn)原理,并列舉常用的卷積神經(jīng)網(wǎng)絡(luò)模型,如LeNet、AlexNet、VGGNet、殘差網(wǎng)絡(luò)等。
第11章:生成性對(duì)抗網(wǎng)絡(luò),主要介紹生成性對(duì)抗網(wǎng)絡(luò)的原理、常見(jiàn)的生成性對(duì)抗網(wǎng)絡(luò)、自動(dòng)編碼器模型及代碼實(shí)現(xiàn)。
第12章:循環(huán)神經(jīng)網(wǎng)絡(luò),主要介紹循環(huán)神經(jīng)網(wǎng)絡(luò)的常見(jiàn)模型層及代碼實(shí)現(xiàn)。
第四部分
第13章:機(jī)器學(xué)習(xí)的入職準(zhǔn)備,主要介紹機(jī)器學(xué)習(xí)崗位及求職者的分布、機(jī)器學(xué)習(xí)崗位的面試技巧,以及機(jī)器學(xué)習(xí)相關(guān)崗位的技能側(cè)重點(diǎn)。
勘誤和支持
鑒于筆者對(duì)機(jī)器學(xué)習(xí)部分理論的理解與認(rèn)知存在局限性,并且由于機(jī)器學(xué)習(xí)的理論體系發(fā)展迅速,故無(wú)法做到完備且詳盡地將相關(guān)理論收錄到本書(shū)中。針對(duì)特定方向(如人工視覺(jué)、推薦系統(tǒng)、語(yǔ)義識(shí)別等)的相關(guān)知識(shí)將在后續(xù)系列叢書(shū)中詳細(xì)闡述。
對(duì)人工智能感興趣的讀者朋友,歡迎以電子郵件(bllizard@yeah.net)的方式與筆者取得聯(lián)系,期待能夠得到廣大讀者真摯的反饋,在技術(shù)的道路上互勉共進(jìn)。
特別致謝
筆者花費(fèi)大量時(shí)間總結(jié)了機(jī)器學(xué)習(xí)的相關(guān)理論框架及代碼實(shí)現(xiàn),在本書(shū)的編寫(xiě)過(guò)程中,首先要感謝我的父母,感謝你們?cè)谖覍?xiě)書(shū)的過(guò)程中的支持和照顧。此外,還要感謝曾經(jīng)的同事李毅、王志遠(yuǎn)、謝瑞杰、朱琦焱、李云海、溫海、丁錦城、楊永邦、張擇儀等人的支持和理解。在此一起表示衷心的感謝。
【讀者服務(wù)】

微信掃碼回復(fù):(38199)
●獲取博文視點(diǎn)學(xué)院20元付費(fèi)內(nèi)容抵扣券
●獲取免費(fèi)增值資源
●加入讀者交流群,與更多讀者互動(dòng)
●獲取精選書(shū)單推薦
- 數(shù)據(jù)展現(xiàn)的藝術(shù)
- 電力自動(dòng)化實(shí)用技術(shù)問(wèn)答
- ETL with Azure Cookbook
- Hadoop 2.x Administration Cookbook
- Natural Language Processing Fundamentals
- 計(jì)算機(jī)應(yīng)用基礎(chǔ)·基礎(chǔ)模塊
- 21天學(xué)通ASP.NET
- 視覺(jué)檢測(cè)技術(shù)及智能計(jì)算
- 現(xiàn)代傳感技術(shù)
- 自動(dòng)控制理論(非自動(dòng)化專(zhuān)業(yè))
- JavaScript典型應(yīng)用與最佳實(shí)踐
- 激光選區(qū)熔化3D打印技術(shù)
- R Data Analysis Projects
- Serverless Design Patterns and Best Practices
- 智能小車(chē)機(jī)器人制作大全(第2版)