- 智能優化技術:適應度地形理論及組合優化問題的應用
- 路輝 周容容 石津華 孫升杰編著
- 2021字
- 2021-08-24 11:50:31
4.1 適應度進化肖像
Smith等人[3]基于一個解附近地形的演化性統計提出了一種新的方法去描述地形特征,通過對具有相等適應度值的樣本的平均化度量,可以構建適應度地形的進化肖像。
可演進性是進化的能力,即種群產生優良變體的能力,因此可演進性與個體可能產生適應度值的潛力有關,而與本身的適應度值的關系沒有那么大,兩個相等適應度值的個體也有著不同的進化能力。一般情況下,研究者基于當前個體或種群的子代提出了一些定義,這里定義一個從父代到所有可能子代之間的傳遞函數。
人們常常認為,在進化過程中可能存在可進化性增長的長期趨勢。然而,由于可進化性與個體產生適應度值潛力的關系比個體適應度值本身更直接相關,因此長期變化不能歸因于直線適應度值選擇。因此,只有通過某種二階選擇機制才能理解任何可演進性變化的趨勢,通過這種機制,進化傾向于保留具有更具進化性的遺傳系統的解決方案。
生物學和進化計算的研究人員通常將可演進性與搜索空間的本地結構聯系起來。例如,Burch和Chao(2000)[4]提出RNA病毒的進化性可以用突變鄰域來理解,而許多進化計算研究者認為改變搜索空間的性質(通過增加中性等機制)可以影響進化性,這可以通過進化速度來證明。因此,進化計算研究者對可演進性的研究通常與搜索空間的崎嶇性和模態緊密相關。但是,這里更關注的是解的局部搜索空間屬性的可演化性。下面介紹傳遞函數和一組簡單的可演化性度量方法[3]。
1.傳遞函數
可演進性的定義是個體和種群產生適應性變異的能力,這個定義與傳遞函數T和種群子代的概率分布函數?有緊密的聯系。
從所有父代基因型h,h′和k,k′中得到子代基因g和f的概率為?(g,f),傳遞函數T是給定h,k,h′,k′得到g,f的概率密度函數。在沒有重組的情況下,只有單親h,k通過突變產生后代,因此上述公式可以寫成
為了簡化問題,這里集中關注一組單基因的子代情況,所以不需要在所有可能的父代集合上進行整合。同樣的道理,由于已經事先選好了父代個體,選擇函數也可以省略。由于只關心子代基因f,傳遞函數就可以簡寫為T(f:h,k)。
傳遞函數不僅包括了操作算子,還包括了表現型,而不是單單表示好的或者不好的操作算子或者表現型。也就是說個體或者種群的可演進性,只是傳遞函數的一個性質。下面根據連續變量的傳遞函數說明單個解可演進性的度量方法。
2.可演進性度量:連續變量
一個基因型是h,適應度值是k的解的可演進性與該解沒有產生更低的適應度值的子代有直接的關系。基于此,可以得出第一個可演進性指標Ea
這是子代適應度值f大于或者等于當前的適應度值k的概率,即變異是有效的。由于傳遞函數T(f:h,k)是一個概率密度函數,所以它的無窮積分等于1,這樣就得到
在此定義下,擁有較低適應度值的解的Ea可能會比擁有高適應度值的解更大,但這僅僅是因為適應度值低的解擁有更多數量的良性突變。第二個可演進性指標Eb僅僅只用了子代的適應度值
這是基因型h子代的期望適應度值。值得注意的是,這個值是依賴適應度值的,所以不應該在沒有參考原來適應度值的情況下進行比較。Ea和Eb都存在一個問題就是它們依賴整個子代的適應度值,與父代相比顯得更優良的子代的比例可能非常小。第三個可演進性指標就反映出了這個問題,這個指標只關注子代適應度值中前百分之C的個體,即
式中,Fc滿足,Ec反映的是只有最高百分之C個體適應度值的期望。另外,還有一個相似的指標Ed計算的是最后百分之C個體適應度值的期望。
3.可演進性度量:離散集
將適應度地形看作是有E條邊(根據操作算子決定)連接的V個端點(基因)構成的有向圖(V,E),集合G是由父代基因h產生的子代,k定義為連接到父節點的頂點,即
適應度值函數F將每個頂點映射到單個適應度值,適應度值F(g)等于或者大于某個適應度值c的子代個體集合定義為
子代適應度值高于或等于父代適應度值的概率,即Ea,就是集合中F(g)≥k的那個部分
子代種群的平均適應度值為Eb,即
具有最高百分之C的子代個體適應度平均適應度值為
其中,Fc定義為。
4.簡單的可演進性示例
將前兩節的度量標準應用于一組簡單的案例,以顯示他們在不同地形中的求解能力,包括平坦的高原、局部最優地形和山坡。圖4-1顯示了三個這樣的案例。
圖4-1 連續一維地形實例
通過將連續可演進性度量(式(4-4)~式(4-6))應用于函數F(x)定義的連續景觀,變異算子概率分布在父代解μ(x,x0)周圍,對于父代解x0(以及后代解x1)的可演進性,獲得了以下結果:
其中,Heaviside函數。
其中,。
類似地,可以用Heaviside函數H[Fd-F(x)]來定義最后百分之D個體適應度值的期望為Ed。
Smith等人在文獻[3]中對于三個地形的可演進性進行了分析。例如,對于第一個地形,其可演進性數據說明了三個問題。首先,沒有變異對于搜索過程是有害的;其次,后代適應度值的期望等于當前的適應度值;最后,后代的頂部和底部四分位數的期望適應度等于當前的適應度。從而可以得出,當前解的領域地形必須是平坦的高原。相關數據可以輔助識別山坡和局部最優地形,但單一指標無法提供全部信息。