官术网_书友最值得收藏!

第二節(jié) 數(shù)字化審計循環(huán)

從數(shù)字化審計的兩大基本任務(wù)可以看出,數(shù)字化審計不是輛“單程車”,而是以目標(biāo)為導(dǎo)向的“理論—實踐—理論”的循環(huán),且是一個不斷迭代、能力呈現(xiàn)螺旋式上升的循環(huán)。

從公司經(jīng)營管理的層面看,數(shù)字化審計是數(shù)字化應(yīng)用于商業(yè)決策的一個子集,總體而言也需要遵循數(shù)據(jù)分析挖掘的基本規(guī)則和路徑。在此前提下,數(shù)字化審計結(jié)合內(nèi)部審計工作的特點,形成了特有的數(shù)字化審計循環(huán)。

一、CRISP-DM:跨行業(yè)數(shù)據(jù)挖掘標(biāo)準(zhǔn)流程

數(shù)據(jù)分析挖掘業(yè)界比較通用的流程是CRISP-DM,CRISP-DM是Cross-Industry Standard Process for Data Mining的縮寫,即“跨行業(yè)數(shù)據(jù)挖掘標(biāo)準(zhǔn)流程”。該流程是由SPSS、NCR等公司牽頭發(fā)起的一個跨行業(yè)的通用流程,不僅供技術(shù)人員、數(shù)據(jù)科學(xué)家使用,也適合不同行業(yè)的數(shù)據(jù)分析人員在分析挖掘數(shù)據(jù)時應(yīng)用。

嚴(yán)格說來,CRISP-DM是一種知識發(fā)現(xiàn)(Knowledge Discovery in Database,KDD)過程模型,在KDD過程模型中占領(lǐng)先位置。經(jīng)典的CRISP-DM模型也是數(shù)據(jù)分析的通用流程,主要包括以下內(nèi)容。

(一)業(yè)務(wù)理解

業(yè)務(wù)理解(Business Understanding)階段主要是確定數(shù)據(jù)分析挖掘項目的目標(biāo)和結(jié)果評價標(biāo)準(zhǔn),評估項目可行性,分析可用的資源、約束條件等,提出項目推進計劃。

(二)數(shù)據(jù)理解

數(shù)據(jù)理解(Data Understanding)階段主要根據(jù)項目的目標(biāo)進行數(shù)據(jù)收集,進行探索性分析,描述數(shù)據(jù),評估數(shù)據(jù)質(zhì)量。探索數(shù)據(jù)中的子集,根據(jù)對數(shù)據(jù)的洞察,形成對隱性信息的假設(shè)。

(三)數(shù)據(jù)準(zhǔn)備

數(shù)據(jù)分析行業(yè)有句經(jīng)典的話:“垃圾進,垃圾出”(Garbage in, garbage out)。數(shù)據(jù)準(zhǔn)備(Data Preparation)階段就是要在理解和熟悉數(shù)據(jù)的基礎(chǔ)上,使用適當(dāng)?shù)墓ぞ邔υ紨?shù)據(jù)進行清洗、多源融合、格式化、變換等操作,選擇合適的數(shù)據(jù)維度,為模型提供原料。

(四)建模

根據(jù)已有的數(shù)據(jù),選擇合適的建模(Modeling)技術(shù)和工具,并對同一問題可應(yīng)用的多種建模技術(shù)進行探索和比較,模型應(yīng)簡單、可靠、可解釋性高。在這一階段,可能需要根據(jù)模型的構(gòu)建和優(yōu)化修正數(shù)據(jù)。

(五)評估

根據(jù)對業(yè)務(wù)的理解和項目目標(biāo)的要求,對模型進行評估(Evaluation),確認(rèn)業(yè)務(wù)和模型的結(jié)合是否能清楚進行解釋、是否存在重大遺漏。在評估過程中,應(yīng)關(guān)注模型運行的前提、邊界等,以及是否存在風(fēng)險。在評估的基礎(chǔ)上,平衡成本、風(fēng)險和收益,最終決定是否部署模型。

(六)部署

開發(fā)模型的目的不僅是洞察數(shù)據(jù)、獲得知識和見解,更重要的是要將獲得的知識和見解以客戶能夠使用的方式展示出來。需要將模型嵌入業(yè)務(wù)決策或者風(fēng)險管理流程中,并形成相應(yīng)的結(jié)果報告。這個環(huán)節(jié)就是部署(Deployment)環(huán)節(jié)。

在CRISP-DM中,始終以基于業(yè)務(wù)理解的業(yè)務(wù)目標(biāo)為導(dǎo)向,六個階段循環(huán),不斷迭代,以無限接近或達(dá)到目標(biāo),如圖2-3所示。

圖2-3 CRISP-DM循環(huán)

資料來源:SPSS CRISP-DM 1.0。

二、數(shù)字化審計循環(huán)

基于CRISP-DM,結(jié)合內(nèi)部審計的特點,形成數(shù)字化審計循環(huán):形成思路—數(shù)據(jù)準(zhǔn)備—分析挖掘—核實查證—總結(jié)提煉—完善思路。該循環(huán)是一個閉環(huán),如圖2-4所示。

圖2-4 數(shù)字化審計循環(huán)

(一)形成思路

整個數(shù)字化審計循環(huán)始于思路,這里的思路是廣義上的思路,包括管理判斷、審計經(jīng)驗、風(fēng)險規(guī)則、監(jiān)測閾值、數(shù)理模型、挖掘算法等。

(二)數(shù)據(jù)準(zhǔn)備

有了思路后,根據(jù)不同思路對數(shù)據(jù)的要求,確定內(nèi)外部數(shù)據(jù)源,進行數(shù)據(jù)申請、采集、融合和清洗,構(gòu)建中間表。

(三)分析挖掘

根據(jù)思路,對數(shù)據(jù)進行分析挖掘,并在此過程中不斷優(yōu)化思路,形成問題清單或者列出需要現(xiàn)場查證的疑點。

(四)核實查證

對于問題清單或疑點,通過現(xiàn)場和非現(xiàn)場方式進行核實查證。在核實查證過程中,根據(jù)區(qū)域差異、審計對象反饋等進行擴展和延伸。

(五)總結(jié)提煉、完善思路

根據(jù)查證的情況進行擴展并進行總結(jié)提煉,根據(jù)問題查證情況和核實過程中發(fā)現(xiàn)的新因素,對原有的思路進行修正或形成新的思路。如此不斷進行循環(huán)和迭代。

主站蜘蛛池模板: 安溪县| 溧阳市| 开封县| 云安县| 大悟县| 武宣县| 攀枝花市| 南康市| 大邑县| 荔波县| 四平市| 松江区| 邳州市| 瓦房店市| 巴里| 安达市| 红桥区| 宁晋县| 正蓝旗| 南雄市| 衡南县| 呼玛县| 河源市| 衡水市| 舞阳县| 内丘县| 乡城县| 阳原县| 沂源县| 中宁县| 兰溪市| 内乡县| 大埔县| 乌审旗| 雅安市| 五峰| 安泽县| 宁波市| 砀山县| 金湖县| 江都市|