1.2 粒計算
近年來,在以模糊集為基礎的模糊計算和以粗糙集為基礎的粗糙計算的基礎上,世界各國的學者又發展了粒計算(Granular Computing,GrC),它是一種新的軟計算方法。
Lotfi A.Zadeh于1979年研究了模糊集與信息粒度(Information Granularity)的關系問題[61]。Stanford大學教授J.R.Hobss于1985年發表于在美國Los Angeles舉行的國際人工智能聯合會議上的論文“Granularity”,直接用粒度這個詞作論文題目。
20 世紀90年代中期,隨著模糊集與粗糙集理論的深入研究,信息顆粒(Information Granules)和粒計算的研究開始興起,波蘭科學家Andrzej Skowron于1992年研究了信息顆粒的規則抽取方法,隨后Andrzej Skowron及其合作者又提出了信息顆粒的構造方法,對信息顆粒與近似空間的關系,信息顆粒的計算和粗糙公理方法等問題進行了深入的探討[62~66];Lotfi A.Zadeh又于20世紀90年代中后期先后發表文章研究了模糊圖、粗糙集與信息粒度的關系,探討了信息粒度化、模糊邏輯與粗糙集的關系以及模糊邏輯與詞計算的關系,分析了模糊信息顆粒化(Fuzzy Information Granulation)及其在人工推理(Human Reasoning)與模糊邏輯(Fuzzy Logic)中的理論與應用等問題。在此期間,Zadeh提出人類認知的三個主要概念,即粒度(Granulation,包括將全體分解為部分)、組織(Organization,包括從部分集成全體)和因果(Causation,包括因果的關聯),并進一步研究了粒計算。他認為,粒計算是一把大傘,它覆蓋了所有有關粒度的理論、方法論、技術和工具的研究。他指出“粗略地說,粒計算是模糊信息粒度理論的超集,而粗糙集理論和區間計算是粒度數學的子集。”[67~70]
T.Y.Lin教授于1996年在UC-Berkeley大學Zadeh的重點實驗室做客座教授時,向Zadeh提出作“Granular Computing”課題的研究。當時Zadeh稱“Granular Mathematics”,T.Y.Lin改稱“Granular Computing”后,立即得到Zadeh的認可,并且縮寫成GrC。所以“Granular Computing”成為今天的一個熱門研究領域。T.Y.Lin發表系列論文研究了二元關系的粒計算、粒化模糊集、利用粒化方法進行關聯規則的挖掘,以及與信息顆粒、顆粒計算有關的關系數據庫的面向機器的數據挖掘建模理論問題[71~77],提出了利用信息顆粒的位表示來進行數據挖掘的思想,他主要的工作是把該思想用于真實世界的建模、數據挖掘的建模和各種關聯規則的發現,其研究方法為數據挖掘提供了一種新的思路。
他們的工作激起了學術界對粒度計算研究的興趣,加拿大學者Y.Y Yao也先后發表論文研究了分層的粗糙集與粒計算、粗糙集與鄰近系統(Neighborhood Systems)和粒計算的關系、信息粒化與粗糙集近似、信息表的粒計算、使用粒化計算進行數據挖掘建模等專題[78~86],并將其應用于數據挖掘等領域。其工作要點是,用決策邏輯語言(DL-語言)來描述集合的粒度(用滿足公式f元素的集合來定義等價類m(f)),建立概念之間的if-then關系與粒度集合之間的包含關系的聯系,并提出利用由所有劃分構成的格來求解一致分類問題。所有這些研究都為知識挖掘提供了新的方法和角度。
粒計算是一門飛速發展的新學科,它融合了粗糙集、模糊集及人工智能等多種學科的研究成果。人們對粒計算的描述是建立在對它的知覺認識上的:粒計算是研究基于多層次結構的思維方式、問題求解方法、信息處理模式及其相關理論、技術和工具的學科[87]。
在我國,粒計算的研究已引起眾多學者的關注與興趣。其研究論題包括:基于商空間理論的粒計算模型、模糊商空間及粒計算的商閉包空間模型;粒計算的覆蓋模糊、粗糙集與粒計算的交叉問題的研究;粒、規則與例外的關系;粒計算的理論、模型與方法的探討;基于Dempster-Shafer證據理論和粗糙集的近似和知識約簡;幾種基于覆蓋粗糙集的粒計算模型;粒邏輯及其歸結原理;基于關系的粒計算模型,粒計算在進化計算、機器學習中的應和使用粒計算進行知識獲取的方法;基于泛系理論的粒計算模型;使用粒分析來描述和刻畫粒計算的思考等[87]。
粒計算借助于其他學科的哲學思想和方法論,并將它們抽象成為與具體領域無關的方法和策略。它的獨特性體現在用系統和結構化的理解和方法來解決復雜問題。對復雜問題的全面理解通常是多視角的,從每一個視角著眼的理解又是多層次的。由此可以得出,粒計算的過程就是對復雜問題的求解過程。它的結果表現為一個多視角和多層次的粒結構。這個粒結構是對此復雜問題的系統且近似的描述和解答。
對粒計算的研究應該著眼于三個觀點:粒計算的哲學思想觀點、方法論觀點及計算模式觀點。從哲學思想觀點考慮,粒計算試圖將人類的認知方式抽象化和形式化,從而提煉出結構化的思維模式;從方法論觀點考慮,粒計算著重研究系統化的方法和技術,將問題求解的過程規范為結構化的、自上而下的逐步求精過程;從計算模式觀點考慮,粒計算關注結構化的信息處理。粒計算的三個觀點可以用三角形來表示,也可以用層次結構或三維空間模型來描述。
1.2.1 信息粒
按照Lotfi A.Zadeh的觀點,信息粒(Information Granule)是通過不可分辨性(Indistinguish Ability)、相似性(Similarity)、近似性(Proximity)或功能性(Functionality)等來劃分的對象的集合。一般來說,人類的認知的有三個基本的概念:粒度(Granulation,也稱粒化)、組織(Organization)和因果(Causation),粒化把整體分解為部分,組織則是把部分集成為整體,而原因則涉及事物之間的關聯[70]。
“Granule”被解釋為中文詞意“基本粒”,在英漢詞典中被說成是緊緊凝結在一起的“顆粒”和“塊”等,“Information Granules”是研究將信息集切割成互不相交的“片”和“塊”等,或劃分成互不相交的“子集”、“組”、“類”和“群”等,實質上是“劃分”(Partition)的意義,表示顆粒之間是清晰、互不相交的。可見粒計算是研究信息劃分的。
“Granulation”被譯為“粒”。Lotfi A.Zadeh于1997年發表的論文:“Toward a theory of fuzzy information granulation and its centrality in human reasoning and fuzzylogic”中 用 了“Granulation”,“Information Granulation”意思是將信息切割或分成可能兩兩有交的“類”和“塊”等,他從模糊集觀點討論,所以被分成的顆粒可能是模糊或不清晰邊緣的“塊”。所以,粒計算是研究信息分類,被分成的塊是兩兩分離的劃分還是兩兩可能有交的模糊分割;研究分成的粒度大小,不同粒度層之間的關系,粒度分解和合并等。
定義1.4[64] 一個定制的近似空間為一個系統AS#,S=(U,I#,vS),其中:
U為對象的非空有限集;
I#:U→P(U),P(U)表示U 的冪集,是一個不確定函數,不確定函數對每個對象x定義了一個相似對象的集合;
vS:P(U)×P(U)→[0,1]是一個粗糙包含函數。
定義1.5[64](信息粒):稱序對IS=(U,A)為信息系統,其中U 為論域,A 為有限屬性集,a∈A,一個基本的信息粒定義為EFB(x),這里EFB為a=a(x)的選擇子的連接,||EFB(x)||IS=||∧a∈Ba=a(x)||IS,其中B?A,x∈U,||●||為公式集Φ 到冪集P(U)的映射函數。
從本質上講,“粒”即基本元素,信息粒是在基本集中具有相同或相似屬性值的對象集合,一個基本粒相當于粗糙集的一個等價類,等價類也稱為等價粒,如決策規則的前件、后件和規則本身等就是一種粒。
定義1.6[64] 設信息系統IS=(U,A),假設S為一粒序列,且IS中||●||IS的語義及其元素已被定義,擴展||●||IS到S 上,定義為||S||IS={||g||IS:g∈S}。
定義1.7[64](粒集) 設信息粒集G 以及IS中的G 的粒||●||IS已經被定義,擴展||●||IS到集合H?G為||H||IS={||g||IS:g∈H}。
對于信息粒來說,有兩個基本的度量:粒的包含度(Inclusion)和接近度(Closeness),下面對它們進行簡要介紹。
兩個信息粒G,G'的包含度至少為P 記為vP(G,G'),類似地,兩個信息粒G,G'的接近度至少為P記為clP(G,G')。
在信息系統IS=(U,A)中,粒由EFB(x)定義,這里EFB為a=a(x)的選擇子的連接,||EFB(x)||IS=||∧a∈Ba=a(x)||IS,其中B?A,x∈U,設G={EFB(x):B?A&x∈U},設α、β∈G={EFB(x):B?A&x∈U},α,β之間的精確包含的定義為:||α||IS?||β||IS,這里||α||IS,||β||IS分別為滿足α,β的對象的集合,而非精確描述,如知識發現的關聯規則里,可以通過兩個閾值t與t'來定義:
supportIS (α、β)=card(||α∧β||IS)≥t且
accuracyIS 。
在一個給定的信息系統中,基本的信息粒包含可以按照不同的方式進行定義,例如:
vI,S (,)t t αβ' 成立當且僅當supportIS(α,β)≥t&accuracyIS(α,β)≥t'。
基本粒的接近度可以定義為:
成立,當且僅當
成立且
成立。
1.2.2 信息粒化
粒化是人類理解認識問題的一個內在的自然活動,信息的粒化相當于把原始復雜的問題分解為多個可定義的子問題,這樣可以降低原始問題的計算復雜性。粒化問題隨處可見,它是許多學科的共同研究課題,如:可以把時間信息粒化形成時間信息粒——可定義的時間間隔。
在很多計算機系統模型中,往往把內存資源粒化為內存頁的概念來做為它的基本操作單位。
盡可能地粒化數字圖像為基本單元——個體像素,這樣便于對一些大的實體進行處理和分析。
在處理問題時,往往趨向于構造規則(if-then描述),這其實已經將問題粒化。
在一個確定的程度上進行數據壓縮也是信息粒化的一個范例。
對于信息的粒化,有兩點需要說明:
(1)信息的粒化是一個自然分層的結構,可以把時間粒化為年、月、日、小時和分鐘這樣一個分層結構。
(2)不同的理論進行粒化的方法是不同的:
集合論使用間隔(區間)分析進行粒化,它的基本粒是定義在實軸上的間隔(Intervals),其形式化的模型為:集合A 定義為給定的論域U(實數R 的子集)到{0,1}上的二值映射:A:U→{0,1},這里A(u)為A的特征函數。
模糊集為集合概念的泛化,模糊集基于元素對于模糊集合的隸屬程度。模糊集通過它們的隸屬函數來形式化地描述:A:U→[0,1],其隸屬值越大,給定的元素x 對于模糊集的附屬程度越強。
粗糙集是給定實驗數據中近似概念的合成。粗糙集中的基本粒是按照等價關系定義的等價類。給定定義在U×U 上的不可分辨關系R,則一個粗糙集由下近似和上近似構成,從根本上說,上、下近似的差別越大,則邊界越明顯,粗糙度越大。
1.2.3 粒計算概念
信息粒度與信息粒是不同且相關的兩個概念。
文獻[88,89]使用一個三元組(U,F,Γ)來描述一個問題,其中:
U 表示問題的論域,也就是要考慮的基本元素的集合;設F為屬性函數,定義為F:U→Y,Y 表示基本元素的屬性集合;Γ 表示論域的結構,定義為論域上各個基本元素之間的關系。
從一個較粗的角度看問題,實際上是對U進行簡化,把性質相近的元素看成是等價的,把它們歸為一類,整體上做為一個新元素,這樣就形成一個粒度較大的論域[U],從而把原始問題(U,F,Γ)轉化為新層次上的問題([U],[F],[Γ])。
粒計算是一種新的軟計算方法,它的基本成分是論域的子集、類和簇。在粒化計算中,主要涉及的問題有粒的描述、粒之間的關系和粒的計算等,它們可以用于很多領域,如聚類分析、概念的形式化、機器學習和數據挖掘等。
目前粒計算的研究主要從粒的構造和粒的計算兩個方面展開。粒的構造包括粒的形式化、表示和解釋。粒的形式化與表示粒構造的算法描述;粒的解釋一般指粒構造的語義,它表明了為什么兩個對象能夠歸為同一個粒,進一步說,信息的粒化依賴于可用的知識。粒的計算則指在解決問題中粒的利用,它也是從語義解釋及算法描述兩方面入手:一方面,人們需要解釋粒之間的不同關系,如相近性(Closeness)、依賴性(Dependency)、關聯性(Association)、定義與解釋粒的操作;另一方面,人們需要設計粒計算的方法與工具,如近似性(Approximation)、推理(Reasoning)和推論(Inference)[84]。
粒計算與數據挖掘的關系可以從概念的形式化與概念關系的確定兩方面來說明。在概念的形式化研究中,一般認為概念由內涵與外延構成:概念的內涵由相關的屬性或特征構成,它表明了對象應用的有效性,概念的外延指相應的對象集,外延中的對象具有相同的特征或屬性,也就是說,外延構成了對象具體的實例。從粒化計算的觀點看,每個粒可以作為概念的一個實例。一旦概念被構造和描述,人們便可用粒構造相應的計算方法。特別地,人們可以根據概念的內涵與外延研究概念之間的關系,比如子概念(Sub-concept)、無關性(Disjoint)、重疊概念(Overlap Concept)和部分子概念(Partial Sub-Concept)等,這些關系可以按照規則或關聯度量來方便地表示[84]。
粒計算的操作對象是信息粒,而信息粒按照粒度的不同展現出不同的層次,即一種分層結構。按照所處理的問題,通常把相同或相似“尺寸”(粒度)的粒劃為一層,如果需要了解更多的細節,則把它們劃為較小的粒,而這些粒則處于另外一層,這樣,按照粒度的不同,信息粒呈現一種自然的分層結構,如上面偏序格結構一樣。
1.2.4 粒計算的研究方法與方向
粒計算的形成和發展積累了多種思想、模型、技術及方法論,對粒計算的研究可以從不同觀點著手。現有的粒計算研究可以概括為三個主要觀點:結構化思維、結構化問題求解和結構化信息處理,它們相互關聯,又自成體系,形成了粒計算特有的三角形[87]。
1.粒計算三角形
在粒計算三角形中,哲學思想偏重思維的結構化,方法論注重問題求解的結構化,計算模式強調信息處理的結構化。多層次粒結構把這三個觀點緊密地結合在一起,形成了研究粒計算的三個觀點,如圖1-1所示。

圖1-1 粒計算的三角形
結構化思維強調了對粒計算的哲學思想的研究。思維本身既是問題求解的必經過程和必要手段,也是人腦對信息進行篩選、分類比較、整理歸納的復雜處理。結構化思維是人類智能的重要體現形式。
結構化問題求解研究粒計算的方法論。張鈸和張鈴教授對這個問題有系統和詳細的論述。從粒計算三角形的角度來看,抽象思維與哲學思想有關,抽象技能與方法論有關。問題求解是一個邏輯化和結構化的思維過程,它需要解決兩個問題:一是構建問題的粒結構;二是在此粒結構中進行問題求解。在某些情況下,這兩個任務的界限并不明顯,需要放在一起綜合考慮。
結構化信息處理注重以計算為主的問題求解。Bargiela和Pedrycz在文獻中對該問題有詳細系統的描述。最近,Wing提出了計算思維的觀點,將結構化思維和結構化信息處理緊密聯系在一起,她認為計算機科學家所采用的計算思維方式可以推廣和應用到不同學科,這就需要不同抽象層次的思維。信息處理是問題求解的一個特例,它本身并不一定需要由計算機完成。信息處理至少可以分成抽象的、人腦中的和計算機中的信息處理三種形式。其中抽象的信息處理與粒計算哲學思想密切關聯,構建對信息的粒結構分析;人腦中的信息處理遵循粒計算的普遍方法論,涉及諸如信息粒化的原則;計算機信息處理強調信息在計算機中的存儲、計算、顯示和傳遞[87]。
2.粒計算的三個層次
粒計算的三個研究觀點之間還存在著層次關系。其中,結構化思維作為其哲學思想指導處于最高、最抽象的層次;結構化問題求解作為方法論處于中間層次;結構化問題求解可以進一步用結構化信息處理實現,因而結構化信息處理位于階梯層次的底部,如圖1-2所示。

圖1-2 粒計算的三個層次
這樣的層次結構反映了哲學思想、方法論及計算模式的關系。如果把粒計算研究作為一個實際問題,那么它也可以從以上三個層次求解。
對粒計算的研究方興未艾,它的數學基礎與理論還很不成熟,有許多問題還值得深入研究。
- Unreal Engine:Game Development from A to Z
- 中文版Photoshop CS5數碼照片處理完全自學一本通
- R Machine Learning By Example
- 蕩胸生層云:C語言開發修行實錄
- 讓每張照片都成為佳作的Photoshop后期技法
- Blender 3D Printing by Example
- Azure PowerShell Quick Start Guide
- Chef:Powerful Infrastructure Automation
- 教育機器人的風口:全球發展現狀及趨勢
- 從零開始學PHP
- 軟件工程及實踐
- Building a BeagleBone Black Super Cluster
- Mastering pfSense
- 21天學通Linux嵌入式開發
- Mastering DynamoDB