官术网_书友最值得收藏!

1.3.1 復雜制造數據預處理

制造系統達到一定規模并且工藝流程較為復雜時,其自動化系統會出現數據量大、生產屬性多、數據源中包含一定噪聲數據等問題。這些問題對基于數據的調度結果有重要影響。因此,對數據源中的相關數據進行預處理是基于數據的調度的重要組成部分。復雜制造數據預處理主要集中于以下三方面:復雜制造數據屬性選擇、復雜制造數據聚類與復雜制造數據屬性離散化。

(1)復雜制造數據屬性選擇

屬性選擇是從條件屬性中選取較為重要的屬性。條件屬性冗余過多會導致分類或回歸的精度下降、生成的規則無法使用以及規則之間的沖突較多。屬性選擇常用的方法包括粗糙集和計算智能。例如,Kusiak針對半導體制造的質量問題,提出了使用粗糙集從樣本數據中獲取規則的方法,并使用特征轉換和數據集分解技術,來提高缺陷預測的精度和效率;粗糙集的屬性約簡是一個NP難問題,Chen等通過特征核的概念縮減了搜索空間,然后使用蟻群算法求得了屬性集的約簡,提高了知識約簡的效率;Shiue等建立了兩階段決策樹自適應調度系統,將基于神經網絡的權重特征選擇算法和遺傳算法用于調度屬性選擇,使用自組織映射(Self?Organizing Maps,SOM)進行數據聚類,應用決策樹、神經網絡、支持向量機這三種學習算法對每個簇進行學習實現參數優化,提高了自適應調度知識庫的泛化能力,并通過仿真驗證了成果的有效性。

(2)復雜制造數據聚類

聚類是對樣本數據按相似度進行分類的技術,將相似的樣本歸屬于同一類,而相似度低的樣本歸屬于不同類。對于大規模訓練樣本,可以使用聚類平滑噪聲數據。噪聲數據會影響學習的精度,如C4.5在處理含有噪聲的樣本時會導致生成樹的規模龐大,降低預測精度,需要做剪枝處理。聚類中常用的方法包括SOM、Fuzzy?C均值、K均值、神經網絡等。

(3)復雜制造數據屬性離散化

部分算法和模型只能處理離散數據,如決策樹、粗糙集等,因此有必要采用屬性離散化技術將連續屬性值轉化為離散屬性值。例如:Knooce和Li在挖掘優化調度方案時,根據面向屬性規約算法和決策樹的特點,對屬性值進行了等距離散劃分;Rafinejad提出了基于模糊K均值算法的屬性離散化方法,使得從優化調度方案中所提取的規則能夠更好地逼近優化調度方案。

現有的復雜制造預處理技術主要集中于屬性選擇和數據聚類,而針對制造系統的數據預處理技術還有待進一步深入研究。因為制造系統數據具有規模大、含噪聲、樣本分布復雜且存在缺失現象;輸入變量數目多、類型多樣;輸入/輸出變量間關系呈非線性、強耦合等特點。

主站蜘蛛池模板: 凤凰县| 留坝县| 西吉县| 安阳县| 彭阳县| 左云县| 桐乡市| 秭归县| 马尔康县| 白山市| 宿松县| 珲春市| 郴州市| 西充县| 兴和县| 昭平县| 罗源县| 济源市| 怀远县| 石台县| 宝丰县| 民县| 信阳市| 北安市| 双鸭山市| 承德县| 遵化市| 玉溪市| 绩溪县| 霍林郭勒市| 即墨市| 二连浩特市| 苏尼特左旗| 牡丹江市| 柞水县| 峡江县| 和田市| 东山县| 隆林| 驻马店市| 关岭|