- 數據驅動的半導體制造系統調度
- 李莉 于青云 馬玉敏 喬非
- 982字
- 2021-12-24 13:32:17
1.3.1 復雜制造數據預處理
制造系統達到一定規模并且工藝流程較為復雜時,其自動化系統會出現數據量大、生產屬性多、數據源中包含一定噪聲數據等問題。這些問題對基于數據的調度結果有重要影響。因此,對數據源中的相關數據進行預處理是基于數據的調度的重要組成部分。復雜制造數據預處理主要集中于以下三方面:復雜制造數據屬性選擇、復雜制造數據聚類與復雜制造數據屬性離散化。
(1)復雜制造數據屬性選擇
屬性選擇是從條件屬性中選取較為重要的屬性。條件屬性冗余過多會導致分類或回歸的精度下降、生成的規則無法使用以及規則之間的沖突較多。屬性選擇常用的方法包括粗糙集和計算智能。例如,Kusiak針對半導體制造的質量問題,提出了使用粗糙集從樣本數據中獲取規則的方法,并使用特征轉換和數據集分解技術,來提高缺陷預測的精度和效率;粗糙集的屬性約簡是一個NP難問題,Chen等通過特征核的概念縮減了搜索空間,然后使用蟻群算法求得了屬性集的約簡,提高了知識約簡的效率;Shiue等建立了兩階段決策樹自適應調度系統,將基于神經網絡的權重特征選擇算法和遺傳算法用于調度屬性選擇,使用自組織映射(Self?Organizing Maps,SOM)進行數據聚類,應用決策樹、神經網絡、支持向量機這三種學習算法對每個簇進行學習實現參數優化,提高了自適應調度知識庫的泛化能力,并通過仿真驗證了成果的有效性。
(2)復雜制造數據聚類
聚類是對樣本數據按相似度進行分類的技術,將相似的樣本歸屬于同一類,而相似度低的樣本歸屬于不同類。對于大規模訓練樣本,可以使用聚類平滑噪聲數據。噪聲數據會影響學習的精度,如C4.5在處理含有噪聲的樣本時會導致生成樹的規模龐大,降低預測精度,需要做剪枝處理。聚類中常用的方法包括SOM、Fuzzy?C均值、K均值、神經網絡等。
(3)復雜制造數據屬性離散化
部分算法和模型只能處理離散數據,如決策樹、粗糙集等,因此有必要采用屬性離散化技術將連續屬性值轉化為離散屬性值。例如:Knooce和Li在挖掘優化調度方案時,根據面向屬性規約算法和決策樹的特點,對屬性值進行了等距離散劃分;Rafinejad提出了基于模糊K均值算法的屬性離散化方法,使得從優化調度方案中所提取的規則能夠更好地逼近優化調度方案。
現有的復雜制造預處理技術主要集中于屬性選擇和數據聚類,而針對制造系統的數據預處理技術還有待進一步深入研究。因為制造系統數據具有規模大、含噪聲、樣本分布復雜且存在缺失現象;輸入變量數目多、類型多樣;輸入/輸出變量間關系呈非線性、強耦合等特點。
- 襯衫制板·工藝·設計
- 基于數學建模的數學實驗
- 高教版《馬克思主義哲學》筆記和課后習題詳解
- 新編鞋靴設計與表現
- 曹龍騏《金融學》(第3版)筆記和課后習題(含考研真題)詳解
- JSP程序設計教程
- 美術高考風向標:中央美術學院、清華大學美術學院設計藝術專業高考試題分析與比較
- 數據處理與管理(Excel、Access及文獻檢索)
- 2020年福建公務員錄用考試專項教材:數量關系【考點精講+典型題(含歷年真題)詳解】
- 3D打印:從全面了解到親手制作(第2版)
- 商務禮儀與溝通(微課版)
- 中國地質大學(武漢)外國語學院242俄語(二外)歷年考研真題及詳解
- 清華大學經濟管理學院經濟學考研真題與模擬試題詳解
- 現代設計方法與產品開發
- 針織服裝藝術設計(第2版)