官术网_书友最值得收藏!

4.2.2 模式相似性測量

1.樣品與樣品之間的距離

設(shè)有兩個樣品的特征值分別為XiX j,即

這兩個樣品可能在同一類中,如圖4-3a所示,也可能在不同的類中,如圖4-3b所示。因此可以計算同一個類內(nèi)樣品與樣品之間的距離,也可以計算屬于不同類樣品與樣品之間的距離。

圖4-3 樣品間的距離示意圖

樣品與樣品間的距離計算有4種方法,分別是歐氏距離法、夾角余弦距離法、二值夾角余弦法和具有二值特征的Tanimoto測度。

(1)歐氏距離

歐氏距離的算法如下:

D ij越小則兩個樣品距離越近,兩個樣品也就越相似。

(2)夾角余弦距離

夾角余弦距離的算法如下:

S值越大則兩個樣品相似度越大。

(3)二值夾角余弦距離

二值夾角余弦距離的算法如下:

該算法要求Xi,X j向量的各個特征都是以二值(0或1)表示,S值越大兩個樣品越相似。

(4)具有二值特征的Tanimoto測度

具有二值特征的Tanimoto測度的算法如下:

該算法要求Xi,X j向量的各個特征都是以二值(0或1)表示,S值越大兩個樣品越相似。

2.樣品與類之間的距離

樣品與類之間的距離如圖4-4所示。ω是代表某類樣品的集合,ω中有N個樣品,X是某一個待測樣品。

圖4-4 樣品與類之間的距離

錯誤!樣品與類之間的距離計算方法有兩種,如下所述。

·計算該樣品到ω類內(nèi)各個樣品之間的距離,將這些距離求和,取平均作為樣品與類之間的距離。樣品與類之間的距離可描述為

·計算ω類的中心點X(ω),以ω中的所有樣品特征的平均值作為類中心,然后計算待測樣品Xω的中心點X(ω)的距離,即

3.類內(nèi)距離

類內(nèi)距離指同一個類內(nèi)任意樣品之間距離之和的平均值。

如圖4-5所示,類內(nèi)點集{Xi,i=1,2,…,N}各點之間的內(nèi)部距離平方為 i,j=1,2,…,Nij,從集內(nèi)一固定點 Xi 到所有其他的 N-1個點 X j之間的距離平方是,同樣道理,取ω類內(nèi)所有N個點的平均距離表示其類內(nèi)距離,即

圖4-5 ω類內(nèi)的距離

4.類與類之間的距離

設(shè)有兩個類ωiωj,如圖4-6所示,計算類與類之間的距離有多種方法,如最短距離法、最長距離法、重心法和平均距離法等。

圖4-6 類間的距離

(1)最短距離法

規(guī)定兩個類間相距最近的兩個點之間的距離為兩類的距離。

ij

式中,d =|Xi-X j|,Xiωi,X jωjij

(2)最長距離法

規(guī)定兩個類間相距最遠的兩個點之間的距離為兩類的距離。

式中,d =|Xi-X j|,Xiωi,X jωj

(3)重心法

將各類中所有樣品的平均值作為類的重心,用兩類的重心間的距離作為兩類的距離。

式中,NiN j分別是ωiωj類中樣品的個數(shù)。

(4)平均距離法

計算兩類之間所有樣本的距離之和,取距離的平均值作為兩類間的距離。

主站蜘蛛池模板: 鄯善县| 水城县| 汝阳县| 温泉县| 册亨县| 栾城县| 库伦旗| 西畴县| 红河县| 南昌县| 哈巴河县| 天祝| 永修县| 山阳县| 淮阳县| 中卫市| 郴州市| 科技| 淅川县| 荆门市| 旌德县| 全州县| 静海县| 余江县| 陇南市| 逊克县| 嘉峪关市| 淅川县| 汕尾市| 囊谦县| 安徽省| 天柱县| 改则县| 留坝县| 丰城市| 大余县| 左权县| 诸暨市| 理塘县| 潼南县| 道孚县|