- Visual C++數(shù)字圖像模式識別典型案例詳解
- 馮偉興 梁洪 王臣業(yè)編著
- 998字
- 2018-12-31 19:39:02
4.2.2 模式相似性測量
1.樣品與樣品之間的距離
設(shè)有兩個樣品的特征值分別為Xi,X j,即

這兩個樣品可能在同一類中,如圖4-3a所示,也可能在不同的類中,如圖4-3b所示。因此可以計算同一個類內(nèi)樣品與樣品之間的距離,也可以計算屬于不同類樣品與樣品之間的距離。

圖4-3 樣品間的距離示意圖
樣品與樣品間的距離計算有4種方法,分別是歐氏距離法、夾角余弦距離法、二值夾角余弦法和具有二值特征的Tanimoto測度。
(1)歐氏距離
歐氏距離的算法如下:

D ij越小則兩個樣品距離越近,兩個樣品也就越相似。
(2)夾角余弦距離
夾角余弦距離的算法如下:

S值越大則兩個樣品相似度越大。
(3)二值夾角余弦距離
二值夾角余弦距離的算法如下:

該算法要求Xi,X j向量的各個特征都是以二值(0或1)表示,S值越大兩個樣品越相似。
(4)具有二值特征的Tanimoto測度
具有二值特征的Tanimoto測度的算法如下:

該算法要求Xi,X j向量的各個特征都是以二值(0或1)表示,S值越大兩個樣品越相似。
2.樣品與類之間的距離
樣品與類之間的距離如圖4-4所示。ω是代表某類樣品的集合,ω中有N個樣品,X是某一個待測樣品。

圖4-4 樣品與類之間的距離
錯誤!樣品與類之間的距離計算方法有兩種,如下所述。
·計算該樣品到ω類內(nèi)各個樣品之間的距離,將這些距離求和,取平均作為樣品與類之間的距離。樣品與類之間的距離可描述為

·計算ω類的中心點X(ω),以ω中的所有樣品特征的平均值作為類中心,然后計算待測樣品X到ω的中心點X(ω)的距離,即

3.類內(nèi)距離
類內(nèi)距離指同一個類內(nèi)任意樣品之間距離之和的平均值。
如圖4-5所示,類內(nèi)點集{Xi,i=1,2,…,N}各點之間的內(nèi)部距離平方為 ,i,j=1,2,…,N,i≠ j,從集內(nèi)一固定點 Xi 到所有其他的 N-1個點 X j之間的距離平方是
,同樣道理,取ω類內(nèi)所有N個點的平均距離表示其類內(nèi)距離,即

圖4-5 ω類內(nèi)的距離

4.類與類之間的距離
設(shè)有兩個類ωi、ωj,如圖4-6所示,計算類與類之間的距離有多種方法,如最短距離法、最長距離法、重心法和平均距離法等。

圖4-6 類間的距離
(1)最短距離法
規(guī)定兩個類間相距最近的兩個點之間的距離為兩類的距離。
ij
式中,d =|Xi-X j|,Xi∈ωi,X j∈ωj。ij

(2)最長距離法
規(guī)定兩個類間相距最遠的兩個點之間的距離為兩類的距離。

式中,d =|Xi-X j|,Xi∈ωi,X j∈ωj。
(3)重心法
將各類中所有樣品的平均值作為類的重心,用兩類的重心間的距離作為兩類的距離。

式中,;Ni、N j分別是ωi、ωj類中樣品的個數(shù)。
(4)平均距離法
計算兩類之間所有樣本的距離之和,取距離的平均值作為兩類間的距離。
