官术网_书友最值得收藏!

1.5 實例3——EasySVM:基于可視分析方法的支持向量機的白盒分析方法

1.5.1 簡介

支持向量機(SVM)是一種常用的監(jiān)督學習方法,在文本分析、計算機視覺、生物信息等領域有著廣泛的應用。然而不同于決策樹等基于規(guī)則的分類方法,支持向量機的“黑盒”特性使得其模型訓練過程和預測過程較難理解。雖然這種隱藏細節(jié)過程的特性使用戶不必陷于煩瑣的細節(jié)參數調整過程之中,但對于非機器學習專家的決策者來說,這種黑盒特性帶來了較低的可解釋性和可信度。同時,支持向量機中非線性核函數的應用使得模型能夠處理復雜的非線性分類問題,但進一步增加了普通用戶的理解成本,降低了可解釋性,并同時增加了計算開銷。

基于上述兩個問題,本案例提出了一種基于“白盒”策略的支持向量機可視分析方法。該方法的目標在于:

①使用交互式可視化方法,使用戶盡可能清楚地理解訓練數據的分布以及模型的核心結構;

②提供一套使用多個線性支持向量機模型逼近非線性分類邊界的方法;

③能夠提取出模型中主要的分類模式,并將其轉化為分類規(guī)則,以便于解釋和傳播分類結果。

1.5.2 方法概覽

傳統(tǒng)的支持向量機模型通常被當作黑盒模型,難以被理解和解釋,并且其核心結構也很難直觀呈現出來。圖1-37展示了迭代式的可視化模型構建過程,其中包含三個主要模塊。

圖1-37 交互式可視化模型構建過程

(1)支持向量機的可視化構建過程

為了讓用戶能夠快速直觀地理解訓練過程中所使用的訓練數據,理解并探索數據分布、尋找數據中的異常值,本案例設計了一種基于正交投影的可視化方案,并同時將基于這些訓練數據構建出的支持向量機模型核心結構展示在視圖中。本案例還設計了一種交互式投影控制方法,可支持用戶對投影角度的自由調整。

(2)局部支持向量機的可視化構建

支持向量機通常使用線性核函數來處理數據中的線性分類邊界。對于非線性分類問題來說,非線性核函數是支持向量機模型中常用的一種方法。然而使用非線性核函數的模型的分類可解釋性更加復雜,并且計算開銷較大。這里提出了一種交互式可視分析方法,如圖1-38中流程(b)所示,通過構建多個線性支持向量機,以達到逼近非線性分類邊界的目的。

圖1-38 流程(a):全局模型構建過程;流程(b):局部模型構建過程

(3)可視化分類規(guī)則抽取

為了解決支持向量機的分類判斷標準難以向非專家用戶進行解釋的問題,我們設計了專門的可視化規(guī)則抽取視圖(圖1-39)。該視圖主要使用散點圖和平行坐標結合的方法,使用戶能夠交互式地在坐標軸上選取分類所在的區(qū)間,以生成分類規(guī)則。

圖1-39 EasySVM系統(tǒng)界面

主站蜘蛛池模板: 贵阳市| 包头市| 彭阳县| 宾川县| 明星| 本溪| 吴川市| 建德市| 缙云县| 宕昌县| 邳州市| 太和县| 咸宁市| 双牌县| 鄂托克旗| 堆龙德庆县| 黎城县| 华池县| 蓬溪县| 专栏| 虎林市| 营山县| 临城县| 彭泽县| 南岸区| 丹东市| 周宁县| 渭源县| 静海县| 兴山县| 顺义区| 新昌县| 永新县| 衡阳市| 岚皋县| 伽师县| 万载县| 诸暨市| 沁源县| 富平县| 丽水市|