第二節 數字化審計循環
從數字化審計的兩大基本任務可以看出,數字化審計不是輛“單程車”,而是以目標為導向的“理論—實踐—理論”的循環,且是一個不斷迭代、能力呈現螺旋式上升的循環。
從公司經營管理的層面看,數字化審計是數字化應用于商業決策的一個子集,總體而言也需要遵循數據分析挖掘的基本規則和路徑。在此前提下,數字化審計結合內部審計工作的特點,形成了特有的數字化審計循環。
一、CRISP-DM:跨行業數據挖掘標準流程
數據分析挖掘業界比較通用的流程是CRISP-DM,CRISP-DM是Cross-Industry Standard Process for Data Mining的縮寫,即“跨行業數據挖掘標準流程”。該流程是由SPSS、NCR等公司牽頭發起的一個跨行業的通用流程,不僅供技術人員、數據科學家使用,也適合不同行業的數據分析人員在分析挖掘數據時應用。
嚴格說來,CRISP-DM是一種知識發現(Knowledge Discovery in Database,KDD)過程模型,在KDD過程模型中占領先位置。經典的CRISP-DM模型也是數據分析的通用流程,主要包括以下內容。
(一)業務理解
業務理解(Business Understanding)階段主要是確定數據分析挖掘項目的目標和結果評價標準,評估項目可行性,分析可用的資源、約束條件等,提出項目推進計劃。
(二)數據理解
數據理解(Data Understanding)階段主要根據項目的目標進行數據收集,進行探索性分析,描述數據,評估數據質量。探索數據中的子集,根據對數據的洞察,形成對隱性信息的假設。
(三)數據準備
數據分析行業有句經典的話:“垃圾進,垃圾出”(Garbage in, garbage out)。數據準備(Data Preparation)階段就是要在理解和熟悉數據的基礎上,使用適當的工具對原始數據進行清洗、多源融合、格式化、變換等操作,選擇合適的數據維度,為模型提供原料。
(四)建模
根據已有的數據,選擇合適的建模(Modeling)技術和工具,并對同一問題可應用的多種建模技術進行探索和比較,模型應簡單、可靠、可解釋性高。在這一階段,可能需要根據模型的構建和優化修正數據。
(五)評估
根據對業務的理解和項目目標的要求,對模型進行評估(Evaluation),確認業務和模型的結合是否能清楚進行解釋、是否存在重大遺漏。在評估過程中,應關注模型運行的前提、邊界等,以及是否存在風險。在評估的基礎上,平衡成本、風險和收益,最終決定是否部署模型。
(六)部署
開發模型的目的不僅是洞察數據、獲得知識和見解,更重要的是要將獲得的知識和見解以客戶能夠使用的方式展示出來。需要將模型嵌入業務決策或者風險管理流程中,并形成相應的結果報告。這個環節就是部署(Deployment)環節。
在CRISP-DM中,始終以基于業務理解的業務目標為導向,六個階段循環,不斷迭代,以無限接近或達到目標,如圖2-3所示。

圖2-3 CRISP-DM循環
資料來源:SPSS CRISP-DM 1.0。
二、數字化審計循環
基于CRISP-DM,結合內部審計的特點,形成數字化審計循環:形成思路—數據準備—分析挖掘—核實查證—總結提煉—完善思路。該循環是一個閉環,如圖2-4所示。

圖2-4 數字化審計循環
(一)形成思路
整個數字化審計循環始于思路,這里的思路是廣義上的思路,包括管理判斷、審計經驗、風險規則、監測閾值、數理模型、挖掘算法等。
(二)數據準備
有了思路后,根據不同思路對數據的要求,確定內外部數據源,進行數據申請、采集、融合和清洗,構建中間表。
(三)分析挖掘
根據思路,對數據進行分析挖掘,并在此過程中不斷優化思路,形成問題清單或者列出需要現場查證的疑點。
(四)核實查證
對于問題清單或疑點,通過現場和非現場方式進行核實查證。在核實查證過程中,根據區域差異、審計對象反饋等進行擴展和延伸。
(五)總結提煉、完善思路
根據查證的情況進行擴展并進行總結提煉,根據問題查證情況和核實過程中發現的新因素,對原有的思路進行修正或形成新的思路。如此不斷進行循環和迭代。