- 數(shù)據(jù)驅(qū)動(dòng)的半導(dǎo)體制造系統(tǒng)調(diào)度
- 李莉 于青云 馬玉敏 喬非
- 358字
- 2021-12-24 13:32:25
3.2?數(shù)據(jù)規(guī)范化
3.2.1 數(shù)據(jù)規(guī)范化規(guī)則
數(shù)據(jù)規(guī)范化是指根據(jù)規(guī)則將數(shù)據(jù)集S的屬性數(shù)據(jù)進(jìn)行縮放,使其落入特定區(qū)間。數(shù)據(jù)規(guī)范化可以消除不同屬性的量綱差異對(duì)數(shù)據(jù)分析結(jié)果的影響。實(shí)踐證明,對(duì)于采用反向傳播學(xué)習(xí)算法的多層感知機(jī)神經(jīng)網(wǎng)絡(luò),對(duì)訓(xùn)練元組中度量每個(gè)屬性的輸入值進(jìn)行規(guī)范化有助于加快學(xué)習(xí)速度;對(duì)于K均值聚類,數(shù)據(jù)規(guī)范化可以讓所有的屬性具有相同的權(quán)重。因此,數(shù)據(jù)規(guī)范化是數(shù)據(jù)分析的必要準(zhǔn)備步驟。本節(jié)介紹兩種最常用的數(shù)據(jù)規(guī)范化方法[24],最大最小規(guī)范化和z?score規(guī)范化。
(1)最大最小規(guī)范化
x'li=(new_maxXi-new_minXi)+new_minXi(3?1)
其中,xli是變量Xi第l個(gè)觀測(cè)值,即數(shù)據(jù)集中第l條記錄的屬性i的取值;[minXi,maxXi]是隨機(jī)變量Xi在數(shù)據(jù)集S中的分布區(qū)間;[new_minXi,new_maxXi]是隨機(jī)變量Xi規(guī)范化后的分布區(qū)間。通常會(huì)把所有變量Xi歸一化在[0,1]區(qū)間內(nèi),以消除量綱的影響。
(2)z?score規(guī)范化
x'li=?(3?2)
其中,μXi是隨機(jī)變量Xi的平均值;σXi是隨機(jī)變量Xi的標(biāo)準(zhǔn)差。
- 工業(yè)控制網(wǎng)絡(luò)
- 網(wǎng)絡(luò)調(diào)研技術(shù)與實(shí)戰(zhàn)
- 中文版InDesign CS5基礎(chǔ)培訓(xùn)教程
- 服飾品陳列設(shè)計(jì)
- 2020年中外教育史考點(diǎn)歸納及典型題(含考研真題)詳解
- 國際貿(mào)易實(shí)務(wù)(英文版)
- 設(shè)計(jì)構(gòu)成(微課版)
- 金融學(xué)基礎(chǔ)
- 2019年江西省選聘高校畢業(yè)生到村任職考試《行政職業(yè)能力測(cè)驗(yàn)》題庫【真題精選+章節(jié)題庫+模擬試題】
- 南開大學(xué)外國語學(xué)院734基礎(chǔ)英語歷年考研真題及詳解
- 服裝外貿(mào)與實(shí)務(wù)
- 薩爾瓦多《國際經(jīng)濟(jì)學(xué)》(第11版)課后習(xí)題詳解
- 工程材料與熱加工
- 2019年成人英語三級(jí)高分范文100篇【命題分析+答題攻略+強(qiáng)化訓(xùn)練】
- 采購與供應(yīng)管理(原書第15版)