- 數(shù)據(jù)驅(qū)動(dòng)的半導(dǎo)體制造系統(tǒng)調(diào)度
- 李莉 于青云 馬玉敏 喬非
- 358字
- 2021-12-24 13:32:25
3.2?數(shù)據(jù)規(guī)范化
3.2.1 數(shù)據(jù)規(guī)范化規(guī)則
數(shù)據(jù)規(guī)范化是指根據(jù)規(guī)則將數(shù)據(jù)集S的屬性數(shù)據(jù)進(jìn)行縮放,使其落入特定區(qū)間。數(shù)據(jù)規(guī)范化可以消除不同屬性的量綱差異對數(shù)據(jù)分析結(jié)果的影響。實(shí)踐證明,對于采用反向傳播學(xué)習(xí)算法的多層感知機(jī)神經(jīng)網(wǎng)絡(luò),對訓(xùn)練元組中度量每個(gè)屬性的輸入值進(jìn)行規(guī)范化有助于加快學(xué)習(xí)速度;對于K均值聚類,數(shù)據(jù)規(guī)范化可以讓所有的屬性具有相同的權(quán)重。因此,數(shù)據(jù)規(guī)范化是數(shù)據(jù)分析的必要準(zhǔn)備步驟。本節(jié)介紹兩種最常用的數(shù)據(jù)規(guī)范化方法[24],最大最小規(guī)范化和z?score規(guī)范化。
(1)最大最小規(guī)范化
x'li=(new_maxXi-new_minXi)+new_minXi(3?1)
其中,xli是變量Xi第l個(gè)觀測值,即數(shù)據(jù)集中第l條記錄的屬性i的取值;[minXi,maxXi]是隨機(jī)變量Xi在數(shù)據(jù)集S中的分布區(qū)間;[new_minXi,new_maxXi]是隨機(jī)變量Xi規(guī)范化后的分布區(qū)間。通常會(huì)把所有變量Xi歸一化在[0,1]區(qū)間內(nèi),以消除量綱的影響。
(2)z?score規(guī)范化
x'li=?(3?2)
其中,μXi是隨機(jī)變量Xi的平均值;σXi是隨機(jī)變量Xi的標(biāo)準(zhǔn)差。
- 化學(xué)基礎(chǔ)實(shí)驗(yàn)操作規(guī)范
- 發(fā)酵工程實(shí)驗(yàn)
- 人工智能技術(shù)及應(yīng)用
- 黑龍江大學(xué)俄語系《俄語2》(第二次修訂版)學(xué)習(xí)指南【詞匯短語+課文精解+單元語法+全文翻譯+練習(xí)答案】
- 大學(xué)生創(chuàng)新創(chuàng)業(yè)基礎(chǔ)
- 信息管理專業(yè)英語教程(附全套音頻·第3版)
- 2020年湖北公務(wù)員錄用考試專項(xiàng)教材:數(shù)量關(guān)系【考點(diǎn)精講+典型題(含歷年真題)詳解】
- Verilog HDL與CPLD/FPGA項(xiàng)目開發(fā)教程(第3版)
- 記者型主持人語言智略研究
- 普通語言學(xué)綱要:英語(外國語言文學(xué)學(xué)術(shù)論叢)
- 農(nóng)產(chǎn)品電商教程:從入門到精通
- 編組站自動(dòng)控制系統(tǒng)維護(hù)
- 海聞《國際貿(mào)易》筆記和課后習(xí)題(含考研真題)詳解
- 湖南師范大學(xué)外國語學(xué)院211翻譯碩士英語[專業(yè)碩士]歷年考研真題及詳解
- 中山大學(xué)中國語言文學(xué)系809世界文學(xué)歷年考研真題及詳解