官术网_书友最值得收藏!

前言

在過去的五年中,筆者有幸深入制造業(yè)數(shù)字化轉(zhuǎn)型一線,在與工業(yè)龍頭企業(yè)深入交流和合作的過程中,目睹了國內(nèi)產(chǎn)業(yè)數(shù)據(jù)基礎(chǔ)的快速發(fā)展,也看到了數(shù)據(jù)思維模式的轉(zhuǎn)變和對(duì)數(shù)據(jù)技術(shù)的理性認(rèn)知?;叵朐缒辏瑸榱蓑?yàn)證數(shù)據(jù)分析技術(shù),只能跨越地域、克服語言和文化的差異,到境外實(shí)施項(xiàng)目,不禁感慨萬千。在過去的二十年中,數(shù)據(jù)平臺(tái)技術(shù)、數(shù)據(jù)分析算法、計(jì)算資源技術(shù)和產(chǎn)業(yè)需求相互促進(jìn)而蓬勃發(fā)展,數(shù)據(jù)思維成為繼邏輯思維、實(shí)證思維和構(gòu)造思維之后的第四大思維范式。七十多年以來,大家一直在探索如何讓計(jì)算機(jī)不用顯式編程就能獲得一定能力的人工智能技術(shù)之路,經(jīng)歷了符號(hào)演算、邏輯推理、自動(dòng)機(jī)模型、進(jìn)化計(jì)算、模糊數(shù)學(xué)、專家系統(tǒng)與知識(shí)工程、神經(jīng)網(wǎng)絡(luò)(特別是自動(dòng)梯度計(jì)算與反演算法)、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等不同模式和階段。得益于計(jì)算機(jī)硬件、產(chǎn)業(yè)數(shù)據(jù)的發(fā)展,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)在行業(yè)應(yīng)用已經(jīng)取得了重大成功。但人工智能探索之路遠(yuǎn)未結(jié)束,科學(xué)家還在繼續(xù)研究基于認(rèn)知和進(jìn)化等特點(diǎn)的強(qiáng)人工智能技術(shù)。另外,對(duì)于復(fù)雜系統(tǒng)的刻畫與建模方法,也期待一些形式化方法的突破。古人有云,物含妙理總堪尋。

在過去五年的工程實(shí)踐中,不時(shí)有工業(yè)界朋友提出,期望有本書能從算法應(yīng)用的角度具象講解工業(yè)數(shù)據(jù)分析課題。但我一直猶豫,一來市面上已經(jīng)存在很多機(jī)器學(xué)習(xí)算法經(jīng)典專著,也有很多優(yōu)秀的算法工具圖書,沒有必要做重復(fù)工作;二來我與團(tuán)隊(duì)當(dāng)時(shí)認(rèn)為行業(yè)數(shù)據(jù)分析項(xiàng)目不落地的主要原因是分析課題定義不規(guī)范和數(shù)據(jù)不完備,而不是算法過程。因此,我們優(yōu)先編寫了《工業(yè)大數(shù)據(jù)分析實(shí)踐》一書,嘗試規(guī)范不同類型工業(yè)分析課題的定義過程。然而在該書出版后的幾個(gè)月內(nèi),很多業(yè)界朋友再次表達(dá)類似的訴求,讓我也逐漸意識(shí)到這種需求主要來自于工科背景人看問題的角度與統(tǒng)計(jì)思維不同,結(jié)構(gòu)方程的慣性讓大家下意識(shí)抵觸非參數(shù)模型、隱性結(jié)構(gòu)模型等計(jì)算模型。

本書嘗試用工科人熟悉的思維模式去解釋常見的機(jī)器學(xué)習(xí)算法。很多算法知識(shí)展開都可以單獨(dú)成書,本書無意做重復(fù)工作,因此,本書中刻意避免了詳盡的理論推導(dǎo)過程,僅討論必要的理論思路和常見的認(rèn)知障礙;在存在既有工具或圖書的地方,直接給出參考文獻(xiàn),幫助讀者快速建立起系統(tǒng)的認(rèn)知框架;簡(jiǎn)化算法包使用過程的介紹,側(cè)重算法背后的工作機(jī)制和超參數(shù)的影響分析,以及算法應(yīng)用到工業(yè)場(chǎng)景中的套路。由此,本書的風(fēng)格更像數(shù)據(jù)分析算法的輔助教材,側(cè)重培養(yǎng)行業(yè)數(shù)據(jù)分析實(shí)操中的直覺研判力。

本書共10章,可劃分為四個(gè)部分。第一部分(即第1章)是數(shù)據(jù)分析概覽,目的是建立起數(shù)據(jù)分析算法的概念框架,并給出學(xué)習(xí)路線;第2~5章是第二部分,側(cè)重在通用數(shù)據(jù)分析算法,包括數(shù)據(jù)預(yù)處理、機(jī)器學(xué)習(xí)、時(shí)序挖掘算法和最優(yōu)化等其他算法;第三部分包括第6~8章,討論了工業(yè)分析的算法思路,覆蓋了生產(chǎn)質(zhì)量分析(PQM)、生產(chǎn)效率優(yōu)化(PEM)等典型分析課題的算法組合套路;第四部分側(cè)重在分析工程方法,第9章討論了工業(yè)專家知識(shí)沉淀方法,第10章討論了數(shù)據(jù)分析的軟件工程。

基于PHM(Prognostics and Health Management,故障預(yù)測(cè)與健康管理)系統(tǒng)的工業(yè)設(shè)備/系統(tǒng)故障診斷是工業(yè)大數(shù)據(jù)分析中的一個(gè)重要領(lǐng)域,存在著豐富有效的研究成果與行業(yè)應(yīng)用。筆者與團(tuán)隊(duì)對(duì)近20年間的主要學(xué)術(shù)期刊與會(huì)議論文進(jìn)行了調(diào)研,分為工業(yè)設(shè)備故障診斷、工業(yè)系統(tǒng)故障診斷、健康評(píng)估三大主題,每個(gè)主題下按照機(jī)器學(xué)習(xí)算法進(jìn)行了分類總結(jié),覆蓋了行業(yè)問題、技術(shù)挑戰(zhàn)、方法路線和應(yīng)用效果等內(nèi)容,形成了近100頁的文獻(xiàn)綜述文檔。原本計(jì)劃將其單獨(dú)成章,考慮到內(nèi)容的特點(diǎn)、讀者檢索論文的便捷性及本書篇幅限制等因素,筆者決定將這些內(nèi)容以電子文檔資源的形式分享出來,讀者可關(guān)注本書封底的“E視界”公眾號(hào),發(fā)送“9787111709619”獲取該文檔。

在本書的編寫過程中,實(shí)習(xí)生李洋、高頌提供了很大的幫助,整理了3.3節(jié)、3.11~3.14節(jié)和第5章的初稿內(nèi)容,并完成了工業(yè)設(shè)備/系統(tǒng)故障診斷電子文檔部分插圖的翻譯工作,6.3節(jié)的內(nèi)容來源于李洋實(shí)習(xí)期間的合作研究。9.7節(jié)部分內(nèi)容來自馬國,圖6-18來自曾聿赟,這里一并表示感謝。感謝清華大學(xué)數(shù)據(jù)治理研究中心孫雪老師和機(jī)械工業(yè)出版社呂瀟老師在選題立意上的研討與建議,你們的熱情給了我寫下去的信心。特別感謝機(jī)械工業(yè)出版社的編輯和各位審閱老師在底稿的編審過程中大量富有成效的工作,致敬在本書出版過程中的全體工作人員。

本書權(quán)當(dāng)對(duì)于工業(yè)大數(shù)據(jù)分析算法的一些初步探討。鑒于精力和篇幅限制,僅僅覆蓋有限的典型算法,內(nèi)容存在欠缺。再加上筆者才疏學(xué)淺,不少提法和表達(dá)尚欠推敲,書中難免有疏漏、錯(cuò)誤之處,還望廣大讀者不吝賜教,日后有機(jī)會(huì)加以勘正。

田春華

2021年12月于北京

主站蜘蛛池模板: 青州市| 昭通市| 江都市| 当雄县| 安丘市| 田东县| 江华| 左云县| 积石山| 广宗县| 建阳市| 金溪县| 高密市| 和龙市| 博兴县| 清徐县| 旬阳县| 九龙城区| 太仆寺旗| 平罗县| 舞阳县| 邢台县| 南岸区| 柳林县| 六盘水市| 苍南县| 阿合奇县| 汝阳县| 祁东县| 中西区| 柳河县| 海丰县| 波密县| 冀州市| 崇州市| 莫力| 台中县| 仙桃市| 仪陇县| 塔河县| 孝昌县|