官术网_书友最值得收藏!

2.3.1 粗糙集理論基本理論

粗糙集理論作為一種研究模糊的不完整、不確定、不一致等各種不完備知識的表達、學(xué)習(xí)、歸納的數(shù)學(xué)理論方法,具有完全由數(shù)據(jù)驅(qū)動、不需要人為假設(shè)的優(yōu)點,更具客觀性。它能在保持知識庫分類能力不變的條件下,通過屬性約簡,剔除冗余信息,導(dǎo)出問題分類和決策規(guī)則,無須提供問題所需處理的數(shù)據(jù)集合之外的任何先驗信息或附加信息,僅根據(jù)觀測數(shù)據(jù)本身來刪除冗余信息,比較知識的粗糙度、知識屬性間的依賴性與重要性,抽取分類規(guī)則,易于掌握和使用。粗糙集不僅為信息科學(xué)和認知科學(xué)提供了新的科學(xué)邏輯和研究方法,而且為信息知識分析與處理提供了有效的技術(shù),已經(jīng)在人工智能、知識獲取分析與數(shù)據(jù)挖掘、模式識別與分類、故障監(jiān)測等方面得到了較為成功的應(yīng)用。

粗糙集作為描述不完整和不確定性知識的工具,其研究的對象或環(huán)境是信息與知識表達系統(tǒng),通過引入下近似(lower approximation)和上近似(upper approximation)概念來表示知識的不確定性。下近似是指所有對象元素都肯定被包含;上近似是指所有對象可能被包含。通過引入約簡和核概念進行知識的分析與處理等計算,簡化信息知識中的冗余屬性和屬性值,進行知識庫的約簡,提取有用的特征信息。約簡就是用對象的部分知識屬性取代全體屬性,從大量數(shù)據(jù)中求取最小不變集合,以簡化對對象的研究。對于不能進行約簡的知識屬性,我們稱之為“核”。粗糙集中對于系統(tǒng)、上近似、下近似以及約簡與核概念的數(shù)學(xué)定義分別如下。

粗糙集將研究對象抽象為一個信息系統(tǒng)或知識表達系統(tǒng),可用信息表表示,而信息表又可由四元組來表示,即

式中:U——論域,是一個有限非空集合,是知識系統(tǒng)中研究對象的集合。研究對象即知識表中的元組或者記錄。U是知識表中所有元組的集合,可以用U={x1x2,…,xn}表示。

A——知識屬性集,是一個有限非空集合,用于刻畫對象的性質(zhì),可用A={a1a2,…,am}表示。

V——知識屬性值集,是一個有限非空集合,可用V={v1v2,…,vm}表示,其中vi是知識屬性ai的值域。

f——知識函數(shù),即

其中,fxiaj)是元組xi在知識屬性aj處的取值。

設(shè)U是對象集,RU上的等價關(guān)系,則稱(UR)為近似空間,由(UR)產(chǎn)生的等價類為

式中:X)——X的下近似;

X)——X的上近似。

X)=X),則稱X為可定義集合;否則,稱X為粗糙集,如圖2.4所示。

圖2.4 粗糙集概念示意圖

定義 給定一個知識表達系統(tǒng)S=<UAVf>,有知識屬性集A'A'?AU/A=U/A',并且不存在一個知識屬性集A″A″?A'U/A″=U/A',則稱A'A的一個約簡。知識表達系統(tǒng)可有m個約簡:A'A″,…,Am,所有約簡的交集C=A'A″∩…∩Am,其中C稱為A的核。

主站蜘蛛池模板: 天祝| 开原市| 宁强县| 阿尔山市| 河源市| 霍山县| 扬州市| 东光县| 平顺县| 垫江县| 富锦市| 海盐县| 沅陵县| 新乐市| 高陵县| 西华县| 伊金霍洛旗| 峡江县| 滦平县| 舞钢市| 高阳县| 遵义县| 岚皋县| 海门市| 犍为县| 临湘市| 攀枝花市| 阿荣旗| 定襄县| 福鼎市| 新乡县| 沙坪坝区| 丰台区| 黔南| 二连浩特市| 甘洛县| 得荣县| 双牌县| 望城县| 东安县| 静海县|