- 基于大智移云技術的財政數字化轉型研究
- 彭程 王宏利 霍然 羅建鋼
- 4667字
- 2021-08-12 18:27:44
第1章 引言
在全面推進工業信息化的全新時代,各行各業都在進行信息化發展,黨和國家領導人也在多個場合提及信息化、數字化、信息網絡等概念,并要求大力推進“工業化、信息化、城鎮化、農業現代化”四個方面協同發展。當下,信息化發展已然成為各行各業轉型發展的趨勢,財政領域的信息化也在不斷進步。
在信息化時代的當下,社會各經濟主體的實踐活動與相關業務數據的產生是不可分割的,這也導致了海量業務數據爆發式的增長已成常態。盡管這些海量的數據信息看似雜亂無章、毫無關聯,但其實通過相應的數據處理,能夠發現眾多數據之間的關聯,從中提取有用的信息,也能將其變為珍貴的數據資源。作為服務經濟社會健康發展的保障與基礎,財政業務也在每天以兆級的速度產生著不可估量的數據資源,但是由于不同財政業務主體對相關業務數據的處理標準不一致,導致了業務數據統計口徑不統一,各級財政部門根據各自情況采集到的財政業務數據有所差異,部門之間數據共享程度低,因此財政業務數據資源的利用率有待提高,價值有待挖掘。
針對傳統數據處理方式無法解決的大數據現象,利用相應的數據處理手段,能夠高效挖掘數據價值信息,并積極促進數據跨領域、跨層級的分享與關聯,從而推動社會相關信息資源的有效交互,并提高政府監管部門對相關數據資源使用詳情的管控力度,將大數據資源轉換為有效的價值信息,以提高社會運行質量,服務人民大眾。值得一提的是,以大數據技術為代表的關于財政相關數據處理的信息化手段,對優化各級政府內部控制和業務運行具有重要的推動作用,有利于實現各級政府的財政治理現代化與數字化,并共同推進中國特色財政治理體系的建設。
隨著財政業務體系的逐漸完善與發展,相應財政數字平臺的建設(即針對業務產生數據的處理)顯得至關重要。一方面,該平臺應當具有高效的數據收集能力,以便對全國范圍內各級財政部門的數據進行全面統計,并根據資產負債具體類別進行詳細分類;另一方面,通過整合各級財政主體管理的數據庫資源,該平臺能夠實現財政單位與其他金融機構關于特定財政數據資源的共享與關聯,以提升數據資源的利用率以及作用廣度。此外,財政數字平臺所特有的數據分析技術以及數據挖掘模型,整體能夠確保財政業務數據價值的最大化,使得原本看似無用的數據資源成為財政監管、政策制定等一系列相關財政活動的數據支撐。
在國家對信息化的大力倡導以及各行各業對信息技術充分利用的共同作用下,以大數據技術為代表的大智移云技術正逐漸成為我國信息化發展的重要推動力,也是信息技術大范圍推廣的主要工具,對我國政治、經濟、社會等各領域都產生了深遠的影響。作為信息化水平的重要體現,大智移云技術的推廣與使用不僅是財政數字化轉型的必經之路,也是我國在中國特色社會主義新時代中邁入更高臺階的強力助推器。隨著信息化水平的不斷提高與技術成熟,大智移云技術已經逐漸滲透入各個領域的應用中,金融機構借此開展“國家金庫工程”研發工作,稅務機關以此建設“金稅工程”,財政部門則致力于“陽光財政”建設工作,可見不同領域的經濟主體部門都致力于數字化轉型研究以及相關數字系統的研發,以上建設工作都會牽涉到財政數據管理以及相關核算的功能服務。因此,財政數字化轉型已經是不可逆轉的趨勢,這不僅是財政相關業務部門日常工作的需要,更是眾多經濟主體對財政數據的強烈需求以及財政數字系統的認可。
具體而言,財政部門關于數字化平臺的功能需求主要是整合跨系統的財政數據資源,實現數據統一處理并提供相應的數據可視化服務,以便滿足財政業務流程辦公需求,優化辦公流程,提高辦公效率,全面推進財政數字化轉型。基于我國信息化發展水平以及財政發展現狀,本書針對財政數字化轉型具體工作進行了詳細研究,旨在解決財政數據管理水平低下、利用率不足的問題,借助大智移云為代表的信息化技術助力財政數字系統建設。主要可以分為以下幾個方面的內容:
第1章,引言。簡要介紹財政大數據的發展進程,平臺提出的背景與意義。隨著互聯網技術的不斷發展,財政數字化也將成為必然趨勢,大數據、機器學習、人工智能、5G、云計算、物聯網等技術的使用促進了財政數字化平臺的發展,有利于解決財政數據采集、存儲、挖掘、展示、決策等問題,促進財政決策數據化與智能化。
第2章,財政數字化轉型平臺的背景分析。主要介紹項目的建設背景與建設目標。本項目是基于財政現實需要提出的,目前,財政數字化的目標不夠明確,對非政府部門的重視程度不夠。財政數字化制度和統計方法不夠完善,數據共享程度低,業務整合難度較大,造成了大量多頭操作、分別維護的情況,影響了工作效率。財政收支統計范圍不夠全面,缺少統一的對外、對內的財政信息系統集成平臺,與上下級財政、代理銀行等的信息共享程度較低,從而造成了信息無法及時互通的現狀,這就需要建設一個財政信息系統集成平臺進行統一處理。另外,財政數字化分析框架不夠健全,沒有建立統一的財政數據倉庫,資源配置決策效率較低。政府財政數字化體系與國際標準仍然存在較大差距。因此,需要建立財政數字化轉型大數據平臺,及時全面地采集財政數據,精準高效地監管財政數據,對財政數據進行預測與挖掘,打造財政數據多維展示報表,實現財政智能應用服務。
第3章,財政數字化轉型項目需求規格說明。主要從項目角度,梳理財政數字化轉型平臺的建設需求與關鍵技術。從需求層面來看,目前的財政數字化轉型平臺還不完善,需要在數據采集、數據存儲、數據檢索、數據分析、數據可視化、數據挖掘、數據決策等方面應用大智移云技術進行相關的提升。為實現這些需求,本書結合目前的大數據與分析技術,使用Flink(數據流執行引擎)技術解決財政數據流式采集與處理的問題,利用Hive(數據倉庫工具)技術解決財政大數據存儲與靜態數據批量統計分析的問題,利用HBase(分布式的,面向列的開源數據庫)技術解決財政大數據實時讀寫的問題,利用MySQL(關系型數據庫管理系統)技術解決實時可視化的問題,并結合邏輯回歸、隨機森林、支持向量機等技術,解決財政數據價值挖掘的問題。在項目設計過程中,遵循標準性、規范化、整體性、成熟性、安全性、可靠性、實用性、靈活性、易用性、集成性、開放性等設計原則進行系統功能設計。在平臺開發過程中,使用了數據融合技術、指標設計技術、全文檢索技術、可視化技術、分布式采集保存與計算技術、大數據挖掘分析技術。
第4章,基于大智移云技術的財政數字化轉型平臺總體建設方案。主要介紹財政數字化轉型平臺的部署架構設計、總體架構設計與平臺概要設計。整個財政數字化技術部署架構分為數據源、服務器集群數據處理與存儲、數據庫、API、數據門戶5個方面,完成財政支出、經濟運行、社會發展、精準扶貧等財政相關數據的收集、處理、存儲與可視化。根據總體框架的數據內容,可將相關財政數據的反饋結果劃分為財政運行、經濟效果、社會發展、就業情況、金融風險幾大類,并通過5G網絡通信技術以及Kafka、Spark等實時數據采集技術接入到HBase數據倉庫與全文檢索庫ELS。在全文檢索庫中的數據通過建立索引,實現快速搜索,為財政建立數據倉庫。HBase數據倉庫中的財政數據資源通過小時與分鐘的聚合,批量導入Hive數據倉庫中。外部API(Application Programming Interface,應用程序接口)數據通過DB(Database,數據庫)API技術,使內部運行數據與財政數據通過Sqoop技術非實時地批量接入到Hive數據倉庫。財政數字化轉型平臺的總體架構可以根據財政業務的實際需求分為7個層次,即資源層、數據源層、采集層、存儲層、計算層、檔案層、應用層。
第5章,財政數字化轉型平臺數據中臺詳細設計。主要設計財政數字化轉型平臺數據中臺的采集、存儲、數倉建模、數據輸出、報表定制等方案。在數據采集過程中,將會規范數據采集方法,明確數據成果的內容需求、成果類型、采集范圍,對敏感的文件類型數據應進行加密處理,并預留數據存儲擴展接口。在財政數據的存儲方案中,將提供數據資源管理、元數據管理、目錄管理、備份管理等數據資源管理功能,以及組織人員管理、財政權限管理、日志管理等系統管理功能。數倉建模主要包括數據接入、數倉實施建設、數據ETL實施工作、數據準確性校驗、數據可視化。數據中臺主要實現對所有財政相關數據的管理,是資源檢索服務功能的擴展,將對財政政策庫資源、研究資料庫資源、財政項目及分析測算庫、機構與專家庫、統計分析數據資源等各種共享資源進行跨區域統一檢索和分級呈現,實現一站式跨庫檢索和數據輸出。報表定制支持各類業務表單的數據采集、公式設置、樣式設置、報表生成。通過可視化表單定制器,提供表單的定制、導入、預覽、打印、導出等多種功能。利用報表定制機制,可以根據業務需要快速定義表單格式,并用于相關業務應用。
第6章,財政數字化轉型平臺數據智能詳細設計。主要從財政運行、社會運行、風險分析、形勢預測、重點項目等方面進行智能報表詳細設計。財政發展情況主要包括當年GDP、就業數量、供給側改革、居民收入、消費、投資、貿易等指標。財政運行情況主要通過財政收入、當月財政支出、財政收支缺口、當月稅收收入等指標展示,通過省份、時間、財政類型等分類,將衍生同比、環比等數值進行趨勢分析、板面分析與區域、財政分布分析。社會運行分析主要是研究影響人類社會內在運動規律的各組成因素的結構、功能及其相互聯系。該部分主要分為就業狀況、居民收入、精準扶貧3部分內容。風險分析主要從財政收入、財政支出、收支缺口、稅收收入、財政風險5部分的指標展開。形勢預測主要分為GDP(Gross Domestic Product,國內生產總值)預測、投資預測、消費預測、貨物與服務進出口預測、通貨膨脹率預測、PPI(Producer Price Index,生產價格指數)預測6大指標內容。財政收入及重點稅收預測指標分析主要分為財政收入預測、國內增值稅收入預測、企業所得稅預測、國內消費收入預測、進口貨物增值稅預測、消費稅收入預測6部分內容。
第7章,財政數字化轉型平臺共享系統建設方案。主要介紹共享系統的總體架構、詳細設計與門戶設計。財政共享平臺的數據層包括兩大板塊7個組成部分。數據層主要分為財政運行與社會發展兩個板塊。財政運行板塊中主要包括財政收入、財政支出、收支缺口、財政風險4部分;社會發展板塊主要分為就業狀況、居民收入、精準扶貧3部分。財政運行板塊的財政收入部分包括預算收入、基金收入、稅收收入等指標;財政支出部分包括公共財政支出、財政基金支出、基建建設支出等指標;收支缺口部分主要包括財政赤字與財政盈余等指標;財政風險部分主要包括政府債務、貨幣數量、貸款額度等指標。社會發展板塊的就業狀況部分包括就業指標、就業人數、失業人數、就業需求等指標;居民收入部分包括城鎮居民收入、農村居民收入、行業平均月薪、月薪集中趨勢等指標;精準扶貧部分主要包括扶貧資金、貧困人口、貧困發生率、貧困縣數量等指標。通過相關信息的獲取,面向財政的政策決策、財政決策、經濟決策、社會決策、風險監控、智能預警、預算管理、決算管理等財政決策主題,根據決策的需求形成不同的多層次決策方案。
第8章,財政數字化轉型其他功能設計。主要介紹系統管理與擴展接口、系統任務調度、接口規范設計、非系統功能設計。系統管理方面,平臺的財政管理和角色權限可以通過分財政、分功能權限、分部門權限、分數據權限的管理手段,全面保障數據安全。系統任務調度方面,實現參數輸入、任務下鉆、任務執行、任務檢查、狀態檢查、狀態更新、狀態還原等功能。接口規范設計方面,設計了規范化的數據導入導出方法。非系統功能設計方面包括安全性、可靠性、可用性、靈活性、易用性、集成性、開放性等設計原則。
第9章,財政數字化轉型項目管理方案。主要介紹項目實施過程中的質量控制、組織管理與分工。