官术网_书友最值得收藏!

CHAPTER 1
第1章 緒論

1.1 群體智能與智能網聯概述

群體智能是科學家長期關注和研究的一種自然現象,通過有效集聚沒有智能或智能水平非常有限的單個智能體,展現出遠超個體能力的智能行為。例如,在很多低等社會性生物群體中可以觀察到群體智能現象,包括魚、鳥、螞蟻、蜜蜂等群體;“三個臭皮匠,頂個諸葛亮”,人類社會的不斷發展和演化也可以被認為是一種群體智能現象,絕大多數文明成果都是人類個體在長期群體化、社會化的生產和生活中逐漸演化形成的產物。因此,群體智能(Collective Intelligence),或者說多智能體系統(Multi-Agent System,MAS),是由多個智能體以特定的方式相互耦合在一起構成的系統。其中,厘清智能體概念、明確系統性度量方法,是在計算機工程領域使用群體智能的重要前提。

智能體的概念是由美國麻省理工學院的Marvin Minsky教授最早提出的[1]。當前,智能體擁有多種不同的定義。作為一個致力于智能體軟件技術標準化的國際組織,FIPA(The Foundation for Intelligent Physical Agents)定義智能體為駐留在環境中的實體,可以解釋從環境中獲得的、能夠反映發生在環境中的事件數據,并可以執行對環境造成影響的行動。著名的群體智能系統研究學者、牛津大學計算機科學系主任Michael Wooldridge對智能體提出了強、弱兩種定義:在弱定義中,智能體是指具有獨立性、自主性、社會性和反應性等基本特性的實體;在強定義中,智能體不僅包含了弱定義中智能體的基本特性,還具有與移動、通信、決策甚至推理等能力相關的智能特性。著名的人工智能學者、斯坦福大學的Hayes-Roth教授定義了智能體的三種基本功能:感知動態環境信息、通過推理來解釋感知到的信息并產生推理結果,以及執行動作來影響環境條件。因此,智能體的特性可以大致概括為:

? 獨立性(Independent):智能體應當具有獨立存在的價值和功能,當給予足夠的外部條件時,智能體可以獨立地行使功能;

? 自主性(Autonomous):智能體擁有對自身行為和邏輯推理的自主控制能力;

? 反應性(Reactive):智能體可以根據周圍環境的變化自動地調整自身的狀態;

? 社會性(Social):智能體可以和其他個體進行協作,進而表現出社會行為;

? 進化性(Evolutive):智能體具有累積經驗和學習知識的能力,可以不斷提升自身的行動或者決策水平。

圖1-1提供了一種智能體的基本結構圖,該圖包含了智能體行使功能的主要單元以及運行邏輯。具體地,感知單元的功能是獲取智能體需要的外部環境信息,一般情況下,由于獲取手段或者獲取代價的限制,單個智能體只能獲取到環境的部分信息。智能體的感知信息會經過數據處理過程被進一步加工,目的是提取出和目標任務相關的特征信息,該特征信息可以作為智能體進行狀態調整或者動作執行的決策依據。針對特定的目標任務,智能體會維護一個事先指定的預測模型,該模型的輸出結果可以輔助最終決策結果的生成。智能體的通信單元主要負責完成當前個體和系統內其他個體之間的信息交換過程,該過程是多個智能體實現目標任務協同的重要基礎。最后,智能體的行動單元負責將最終的決策結果轉換成實際的執行動作。綜上所述,智能體的主要行為邏輯可以概括為“感知決策行動”。其中,在決策階段,由于單個智能體往往只能獲取到外部環境的部分信息,因此有必要通過在多個智能體之間添加合適的協作過程來提升決策水平。另一方面,單個智能體受限于體積、功耗等,有時無法單獨滿足GPT-3等大規模新興神經網絡模型[2]對算力廣泛迫切的需求。再者,由于感知、預測、決策等不同學習任務之間的耦合現象日益凸顯,通過網聯智能體形成分布式的群體智能系統,讓不同類型的智能體各司其職,從而提升系統整體智能水平,成為一個迫切的需求。

圖1-1 智能體的基本結構圖

美國經濟管理學家Herbert Simon的有限理性決策理論(Bounded Rationality Decision Theory)為群體智能系統的有效性奠定了重要的理論基礎。該理論認為,一個系統把多個智能體組織起來可以彌補單個智能體在任務能力上的有限性;每個智能體都專門負責一項任務,可以彌補單個智能體在學習新任務能力上的局限性;系統間有組織的信息流通可以彌補單個智能體的知識的有限性;明確的系統組織和任務分工可以彌補單個智能體在處理信息和應用信息能力上的有限性。因此,群體智能具有“分布智能、持續增強、實時交互”的特點[3]。需要說明的是,與分布式問題求解(Distributed Problem Solving, DPS)過程不同,群體智能系統的設計是一個自底向上的過程,需要首先構建智能體模型,然后在智能體模型基礎上針對任務目標建立合適的群體溝通機制。

作為群體智能的經典領域,遺傳算法(Genetic Algorithm, GA)[4]、蟻群優化(Ant Colony Optimization, ACO)算法[5-6]、粒子群優化(Particle Swarm Optimization,PSO)算法[7]以及共識主動性(Stigmergy)算法[8]等群體協作算法從自然界動物群體的群體行為出發,通過計算機模擬的方式來實現類似的群體協作過程,進而發現和提煉出有價值的群體協作機制。雖然蟻群優化算法[5-6]等通過模擬生物群體行為可以實現集中式優化,但群體智能具有更強的概念內涵,更加強調“多個智能體的互相認同與能力增強”[3]。事實上,群體智能的理念已經在維基百科和reCaptcha項目中得到了廣泛的體現。例如,得益于互聯網技術的出現和不斷發展,人類群體的跨時空大規模協同成為可能,使得網絡空間中的人群不再受到地域和時間的限制,在網絡空間中進行更加方便靈活的顯式或隱式交互。正因如此,維基百科搭建了互聯網用戶共享、獲取知識的平臺,賦予了用戶協作共建世界上最大知識社區的能力,大大超越了以往單一人群的知識邊界。因此,群體智能的水平既受制于單一智能體的能力水平,又受內部的組織規則和信息交互能力的影響。而后者是群體智能系統的重要組成部分,對系統的有效性和穩定性的影響更加深遠。伴隨著新一代無線通信技術(5G)以及物聯網技術的快速發展[9],越來越多的現實場景傾向于使用群體智能理念來構建系統模型,這些場景包括大規模無人機群的控制[10]、工業自動化控制[11]、移動群體感知和計算[12]、車聯網控制以及分布式計算網絡資源管理等。在這些場景當中,基于中心控制器的傳統解決方案缺乏足夠的實時性、魯棒性和靈活性;而得益于通信網絡的快速發展,可以嘗試通過設計和利用分布式群體智能系統來提升這些場景中管理和控制方法的有效性。另外,群體智能中知識共享與協作的能力,也可以助力機器間的通信,更好地支撐萬物智聯的發展[13]。

群體智能的產生也被認為是智能體的相互作用自然涌現在群體層面的結果,這一現象也被稱作智能涌現(Intelligence Emergence),已經得到廣泛的分析和論證。目前最著名的用于分析智能涌現的研究模型是Boid模型[14]和Vicsek模型[15],通過分析和利用這些模型,人們可以觀察到群體智能系統的智能涌現現象。智能涌現過程是一個從局部到整體的過程,涌現的最終結果無法直接通過觀察單個智能體的行為來預先得到,具有不可預測性。群體智能的研究內容之一就是關注如何構建多個智能體之間的協作機制,目的是引發期望的智能涌現現象,其構建方法通常受到算法模型的啟發。除此之外,單個智能體的行為策略往往是事先指定的,這種設置有利于對群體智能涌現的最終結果進行分析。然而,當單個智能體的行為策略無法事先指定,或者設計合適的行為策略成本較高時,傳統的群體智能系統的設計方法就會受到嚴重限制。同時,群體智能水平在很大程度上也取決于群體內單個智能體的智能水平,限制單個智能體的行為策略也會對整個群體的表現造成影響。因此,在建立群體智能系統模型時需要考慮引入單個智能體的學習和進化能力,智能體的主要行為邏輯和大名鼎鼎的強化學習基本過程不謀而合。

主站蜘蛛池模板: 翁牛特旗| 宜章县| 喀什市| 平南县| 曲松县| 山东| 乌恰县| 福建省| 同仁县| 林甸县| 麻栗坡县| 普兰店市| 沙雅县| 阳江市| 颍上县| 东乡| 瓦房店市| 莆田市| 南华县| 霞浦县| 舒兰市| 梨树县| 万源市| 冷水江市| 太原市| 铅山县| 罗城| 清远市| 滨海县| 通许县| 海阳市| 台前县| 自贡市| 砚山县| 昌都县| 金寨县| 广德县| 九龙县| 隆回县| 长岭县| 怀集县|