- 中國戰略性新興產業研究與發展·智慧工業
- 王時龍等編著
- 10字
- 2022-06-17 16:50:17
3.2 大數據特征提取方法
3.2.1 深度自編碼網絡數據特征提取
在實際應用中,原始時域信號經常被噪聲所影響,因而很難提取到有效的特征。針對這一問題,相關研究人員提出了各種解決辦法,常用的方法有先對原始信號進行降噪預處理,再利用深度學習模型提取特征。傳統的設備故障診斷方法大多屬于需要有標簽樣本的淺層學習方法,學習能力具有一定的局限性,無法充分挖掘數據深層特征,在應對高維高噪聲復雜非線性問題方面表征能力不足。深度學習作為機器學習領域的新興方法,已經在圖像識別、自然語言處理、語音識別等領域得到了廣泛應用,這也為故障診斷提供了新的思路。
如今,深度自編碼(DAE)網絡成為深度學習領域中應用較為廣泛的一種網絡重建模型。它通過對信號的編碼和解碼過程來研究信號特征,因此深度自編碼器也可以被視為一個能夠處理復雜非線性問題的特征提取工具,它可以直接從原始信號中獲取其最為顯著的特征向量,有效減少人工標注造成的特征信息遺漏,因此能學習到較為完善的多源信號特征并實現多源融合的故障診斷,為融合多傳感器信息的故障診斷技術提供了新思路。其中,自編碼網絡可以通過所構建的堆疊自編碼器(SAE)來對輸入數據進行逐層學習從而達到特征提取的目的,同時也可以嵌入降噪自編碼器(DAE)進行信號數據噪聲去除。變分自編碼器(VAE)通過對輸入信號的均值和方差來編碼和解碼信號數據,其編碼過程被稱為特征壓縮。在工業過程中,機械設備的運行工況通常為非恒定工況,而變分自編碼器是一種生成網絡模型,模型通過對隱含層變量服從高斯分布的先驗結果較好地表征原始信號輸入的分布特性,該模型具有很好的泛化能力。量化變分自編碼器(VQ-VAE)是最近針對輸入信號的低維度和高維度提出的變分自編碼改良模型,自編碼網絡通過不同的非線性結構組合來達到提取特征的目的。下面介紹深度自編碼網絡在故障信號中的特征提取過程。
有監督學習能有效地對數據和任務進行分類,但難以重構原始信號。例如,人能有效地識別真假紙幣,但是難以去畫出紙幣,即在分類任務中有一些數據提供學習并能從中提取很豐富的特征,雖然能分辨出這些數據的差異,但這些特征并不足以重構原始數據。也就是說,對于數據集和任務分類來說,合理的、充分的特征并不一定能完成圖像重構。若通過搭建多層自編碼的方式來對輸入信號的特征進行編碼到高維空間中得到特征數據,最后再用相對應的解碼器對特征數據解碼,這種堆疊編碼的方式能對數據進行重構,如圖3-5所示。

圖3-5 堆疊自編碼器結構
多層自編碼由多個單層自編碼組成,單層自編碼和解碼方式可表示為
式中,x為輸入向量;h為編碼器的隱空間編碼向量;y為解碼器輸出的解碼向量;f為函數;W(1)、W(2)為權重矩陣;b(1)、b(2)為偏置量。

其中模型損失函數計算公式為

式中,W1為權重矩陣;b1、b2為偏置向量;Xi為實際值;Xi為預測值;J為損失函數。
堆疊稀疏降噪自編碼神經網絡的初始參數是通過無標簽數據預訓練獲得的,初始參數在少量有標簽數據監督下利用BP神經網絡進行優化,形成具有特征提取和模式識別功能的深度降噪自編碼神經網絡。
深度降噪自編碼算法模型可以當作特征提取器,在模型訓練中通過添加噪聲層來干擾模型訓練,使模型能自動提取擾動信號的抽象特征。但是在實際訓練中,單層自編碼網絡往往對數據噪聲還不夠敏感,淺層降噪自編碼模型很難提取有用的特征信號,可將多個降噪自動編碼模型如同堆疊自編碼器堆疊在一起形成堆疊降噪自編碼網絡(SDAE)進行網絡訓練。在頂層加入一個可自上向下微調整個網絡的模型分類器,采用逐層訓練的方式進行特征提取訓練,最后達到去噪和識別特征的目的。
降噪自編碼的噪聲層:

式中,x為輸入向量;ε為噪聲向量;x?為輸出向量;σ2為方差;I為單位向量。
編碼映射關系:

式中,x為輸入向量;w為權重向量;b為偏置向量;y為輸出向量;fθ、s為編碼函數。
解碼映射關系:

式中,y為輸入向量;w′為權重向量;b′為偏置向量;z為輸出向量;g、s為解碼函數。
重建信號的損失函數為

式中,xi為實際值;zi為預測值;L為損失函數;arg表示取平均值;θ={w,b},θ′={w′,b′},θ、θ′、θ*、θ1*為損失值。
引入Dropout的方法可以讓稀疏降噪自編碼深度神經網絡顯著提高分類準確率。為了提高模型的魯棒性和泛化性,利用Dropout方法降低深度網絡的過擬合現象,Dropout公式表示為

式中,Bernoilli為0~1概率生成函數。
在實際應用中,采集的數據大多是離散的,但在特征編碼中,如自編碼器,生成的編碼向量都是連續型變量,無法直接生成離散變量。生成連續型變量往往還存在梯度消失的問題,以及在降維、重構過程中,如何保證重構之后數據不失真的問題。如果失真得太嚴重,將不能表征數據特征。
編碼器(Enconder)為

解碼器(Deconder)為

通過深度自編碼網絡的方式可以解決以下問題:
1)在工業領域擁有大量數據,其中既包含有價值的信息,也包含很多無效信息,而且隨著數據維度的增加,有效信息會變得非常稀疏。深度自編碼網絡是一種通過多層非線性結構對數據進行高層抽象的算法,能夠從海量數據中挖掘出有效的信息。通過數據驅動的深度自編碼網絡能充分利用工業領域的數據。
2)工業系統中的機械系統十分復雜,人工的特征構造需要涉及很多知識領域,從而導致特征構造的難度增大。而深度自編碼網絡能學習擁有強大的自動特征抽取能力,自動地進行特征抽取,進行無監督方式的特征提取,不需要人工參與特征的構造,通過網絡多層次的抽象來實現數據特征挖掘,具有很強的通用性。
- 網絡服務器架設(Windows Server+Linux Server)
- Python Artificial Intelligence Projects for Beginners
- 計算機原理
- Expert AWS Development
- Visual C++編程全能詞典
- 四向穿梭式自動化密集倉儲系統的設計與控制
- LAMP網站開發黃金組合Linux+Apache+MySQL+PHP
- MCGS嵌入版組態軟件應用教程
- Salesforce for Beginners
- 30天學通Java Web項目案例開發
- Raspberry Pi 3 Projects for Java Programmers
- ARM嵌入式系統開發完全入門與主流實踐
- INSTANT R Starter
- 單片機與微機原理及應用
- 仿蛛機器人的設計與制作