- 交通大數據人才隊伍建設研究:以貴州為例
- “貴州交通大數據人才隊伍建設研究”課題組
- 5603字
- 2021-06-03 10:40:04
第二節 大數據對交通運輸業及其從業人員的影響
我們正處在一個大數據、物聯網、人工智能迅速發展的時代,雖然大數據科學與技術剛剛興起,但它對包括交通運輸業在內的傳統產業的巨大影響已顯現出來。
一方面,“互聯網+”、大數據、物聯網、人工智能、云計算、區塊鏈等現代信息技術會極大地提升傳統交通運輸業的水平和效率,釋放傳統交通運輸業的潛能和價值。另一方面,以大數據為中心的現代信息技術加上5G時代的來臨,會對包括交通運輸業在內的傳統產業進行升級、改造、融合,以大數據科學與技術為基礎的交通運輸業會重新洗牌,會與智慧城市、智慧社區、智慧農村、智慧國家一起成為整個智慧社會的一部分,是智慧社會的重要基礎。相應地,交通運輸業的格局以及包括交通運輸運營、監管、服務、規劃、建設、養護等交通運輸業的具體從業人員也會在大數據時代發生重大的甚至根本的改變。
一、交通運輸業的數據特點及其大數據性質和要求
大數據應用最先是從谷歌、阿里巴巴等大型互聯網企業開始的。今天,在人們的言談中,每提大數據,必稱電商大數據、政務大數據等。實際上,相比其他行業,交通運輸才是大數據的主戰場,交通運輸業是產生大數據的天然場所。
交通運輸是通過運輸工具在運輸線網上的移動以實現人和物的位移,創造最大的空間效用和時間效用,以獲取最大的經濟效益、社會效益以及國防、軍事、政治效益的行業領域,涉及交通運輸工具、線網、人員、物資、地理、地質、水文、空間、氣候、環境等多點多面多線及其交互性等多方信息,具有點多、線長、面廣、交互性強的特點。
為建設便捷、安全、高效、舒適、環保的交通運輸體系,提供效率高、成本低、污染小、質量優、安全性好的運輸服務,特別是為了解決當今嚴重的交通擁堵、環境污染、事故頻發等嚴重的交通問題,滿足快速、便捷、舒適、安全、綠色的出行要求,隨著交通運輸信息化建設的發展,今天的交通運輸行業系統內已經積累了各式各樣的數據集。比如,地理信息數據、路基路況數據、路橋隧道數據、設備基準數據、設備運維數據、車載設備數據、駕駛監控數據、遙感數據、GPS數據、場站碼頭數據、卡口數據、貨物數據、出行數據、行人數據、氣象數據、水文數據、ETC收費數據、車流量數據、事故數據、違章數據、處罰數據等。
這些數據包括公路、鐵路、航空、水運等多行業的設施(如路網)、設備(如車輛)、人員、安全保障等基礎數據,還包括綜合交通網絡中的人、車、路、環境等相互作用的關系數據,如速度、密度、流量、位置、票價等。
按照數據類型可分為結構化數據、非結構化數據(視頻、圖片、語音)和半結構化數據;按照數據形式可分為傳感器流數據、數據文件、數據庫記錄、在線文字和圖片、音視頻等;按照數據的產生和變化可分為基礎數據、實時數據、歷史數據、統計數據、結果數據等。
典型的如城市交通數據。按照數據與城市交通關聯性的強弱,城市交通數據可分為基礎數據、運行數據、互動數據、關聯行業數據、重大關聯活動數據和調查數據6類。①基礎數據:道路、橋梁、鐵路、航線、機場、巷道、港口、碼頭等基礎設施數據,城市區劃、地面交通線網、軌道交通線網、人口、出行等數據;②運行數據:城市交通管理運行直接產生的數據,包括各類道路交通、交通卡口、公共交通、對外交通的線圈、軌道閘機、司乘人員、行人、出租車系統的GPS、視頻、圖片等數據;③互動數據:公眾互動提供的交通狀況數據,如通過微博、微信、論壇、廣播電臺等提供的文字、圖片、音視頻等數據;④關聯行業數據:與城市交通相關行業和領域如氣象、環境、公安、人口、環保、規劃、統計、電信等導入的數據;⑤重大關聯活動數據:與交通運輸有關的重大社會經濟活動如重要節假日、體育賽事、文娛活動、傳統民俗、經濟活動等數據;⑥調查數據:居民出行調查、道路交通調查、公共交通調查、專項輔助調查等數據。6類數據與交通管理和服務的關聯度整體依次降低,但呈現隨機化、個別化和突發性的特點。
根據交通運輸部科學研究院2017年發布的交通運輸行業信息資源目錄,整理得到交通運輸行業交通運輸數據信息類別有500余類,具體有6900余項,主要是公路和水路。若加上鐵路、航空、管道、物流、郵政等其他交通運輸系統,那數據類型或種類更加多樣和復雜。不同交通運輸行業數據有相同或相似的方面,但會存在明顯的行業差別。無論如何,在數據來源和數據類型上交通運輸數據都呈現來源多樣、類別紛繁復雜和結構復雜多樣的特點。隨著行業信息化的加速發展,各類交通數據還將日益豐富和完善。
據報道,2015年我國交通數據量已經從TB級別上升到PB級別。當前我國交通運輸行業業務信息管理系統有700余種,數據規模以PB量級計。例如,全國重點營運車輛聯網聯控系統每天接收的300多萬輛客貨運車輛的10億多條衛星定位數據,海事系統的船舶自動識別系統(Automatic Identifi-cation System,AIS)月均數據量達到17.2億條,高速公路運營企業采集傳輸的視頻數據日均數據量已達到PB級,聯網收費數據月均7億條以上,滴滴每天處理的數據量超過2PB。
交通運輸數據具有數據量大、數據來源多樣、數據類型多、結構復雜、數據增長率高、并發量大、實時性強的特點。今天的交通運輸數據已具備鮮明且不同的大數據特征。
由于數據量大、數據分散、形態各異,用傳統技術難以在合理時間內進行采集、管理、處理和分析,必須使用大數據的解決方案。甚至現有大數據技術也難以滿足交通大數據的要求,必須開發或演化出數據處理技術手段多樣、對大流量實時數據處理要求高、面向多用戶多用途分析的交通大數據解決方案。
比如應進行多用戶海量、異構、有效數據的高質量、高效率共享和交換的大數據系統方案研究,尋找到包括跨行業多源異構大數據集成化采集技術、跨行業多源異構大數據預處理技術、跨行業多源異構大數據集成融合技術等,以實現多源異構數據之間的數據信息資源、平臺資源、網絡資源和應用資源的有效融合和共享,為大規模現代綜合交通系統的時空感知和運行狀態管控提供技術支持。
當前,交通大數據發展的必然性和所蘊藏的巨大價值已經得到業界的一致認可,但是其落地使用和規模化發展仍然面臨許多挑戰。
面對管理上條塊分割的交通運輸行業現狀,要解決今天的交通問題,協調各業務領域、各交通運輸行業在質量參差不齊的行業現狀中采集、處理、分析、應用數據,挖掘數據的價值,實現一切業務數據化、一切數據業務化,以及交通運輸產業數據化,交通大數據產業化的交通大數據發展基本要求,不只是技術方面的事,單是在管理、政策、機制、體制上,就有很長的路要走。
二、交通運輸業新一代信息技術人員的大數據素質和要求
隨著交通大數據時代的來臨,新一輪科技革命蓄勢待發,以大數據、物聯網、移動互聯網、云計算、人工智能等為特征的新一代信息技術的快速發展,為傳統交通運輸的升級改造和現代綜合交通運輸體系建設與發展提供了強大的技術支持。
交通大數據技術解決方案或價值的實現,無論在技術層面、系統集成層面、優化整合層面都有許多問題要解決。但支撐和解決這些問題,首先需要大數據從業者即交通運輸業新一代信息技術人員具有相應的素質和能力。
第一,交通運輸業新一代信息技術人員要有鮮明的時代意識和強烈的責任擔當。大數據技術和方法對交通運輸的影響,不同于以往任何一種技術手段,其應用是深遠的,影響是重大的。
第二,交通運輸業新一代信息技術人員要有到位的大數據思維,包括數量思維、整體思維、集成思維、系統思維、分段思維、多面思維、容錯思維、關聯思維、預測思維、本質思維、核心思維、效率思維、價值思維等,是這些思維類型的整體或大部分,而不只是某一種思維類型或某幾種思維類型。
第三,交通運輸業新一代信息技術人員要有交通大數據基礎技術能力。掌握大數據采集處理、大數據存儲管理、大數據計算模式、大數據分析挖掘、大數據可視化和大數據安全等業務鏈上一個或幾個相關聯環節的技術工具,使交通大數據解決方案落地。
第四,交通運輸業新一代信息技術人員要有交通大數據技術創新能力。主動結合交通大數據的特殊性、復雜性,使用已有的大數據技術方法或其他學科技術方法,創新性或創造性地解決行業領域內的特殊問題。
第五,交通運輸業新一代信息技術人員要具有交通運輸科學及數據科學的基礎知識、基本原理和基礎理論。
第六,交通運輸業新一代信息技術人員要有清晰的警覺意識、敬畏心和自律性。大數據有大智慧和大能力,就得有大擔當大約束大規范。數據安全是大數據時代和大數據價值的重中之重,否則有百害而無一利,但安全的根本,首先從大數據從業者有一顆有警覺性和自律性的安全“心”開始。
總體來看,大數據時代交通運輸業新一代信息技術人員就是要往交通運輸領域的大數據專業人才方向發展,成為交通大數據人才。
概言之,所謂交通大數據人才,是指具有大數據思維,有計算機、網絡、數學、統計學、數據科學、信息科學基礎知識,擁有交通運輸業知識,熟悉行業業務,了解行業痛點,掌握分布式儲存、并行式計算、數據挖掘等大數據技術,能解決交通大數據采集、存儲、管理、檢索、挖掘、呈現、應用等業務需求的復合型專門人才。
具體地,交通大數據人才還應在素質、知識、技能、經驗、思想和品格上滿足相應的要求。具體內容詳見第二章第一節“貴州交通大數據人才素質建設”中的相關內容。
三、交通大數據人才的類別和特征
經過科學普及、企業推廣、政府推動、輿論宣傳、商業炒作、風投熱捧,大數據如今也變得耳熟能詳。特別是以大數據和人工智能為噱頭的各種炫黑產品、事件和技術問世,在使大數據為人所熟知的同時,也使大數據的含義比較泛化。目前,大數據已具有時代、科學、技術、商業、市場、文化、思想等多種含義,但最根本的是其科學和技術含義,因為大數據從本質上說就是一種要素,只不過是一種很特別的要素,大數據的根本和關鍵是大數據技術解決方案,其他衍生含義或泛化含義是以此為基礎而產生的。
大數據強調的是全面、系統、整體的大數據技術解決方案,要求可行、優化、高效、開放、穩定、安全、便捷,大數據類型和處理要求會有行業差別,主要是在數據基礎和數據應用兩端。從根本上看,大數據技術解決方案的邏輯過程、關鍵問題、核心技術和主要工具,在不同業務、產業和行業中沒有大的不同,只有好和壞、簡和繁、粗和精、低和高的區分。這從本質上取決于大數據科學技術及工具水平,從根本上取決于相應行業的大數據從業者。在交通大數據領域,具體的就是交通大數據人才。
在交通大數據領域,大數據從業人員主要分布在交通大數據技術解決方案的各個業務環節上,典型的有大數據采集處理、大數據存儲管理、大數據計算模式、大數據分析挖掘、大數據可視化和大數據安全等,在業務鏈上的一個或幾個相關聯環節。以此為依據,交通大數據人才可按業務鏈縱深面的不同劃分為交通大數據采集處理人才、交通大數據存儲管理人才、交通大數據計算模式人才即交通大數據科學家、交通大數據分析挖掘人才、交通大數據可視化人才、交通大數據安全人才等類型。現階段主要有交通大數據規劃師、交通大數據工程師、交通大數據架構師、交通大數據分析師、交通大數據科學家五類。
交通大數據規劃師:研究、發現、認識交通運輸業中的大數據本質,找到相應大數據解決手段、方法和路徑,規劃和制訂切實可行的大數據解決方案。
交通大數據工程師:負責大數據解決方案操作、測試、運維、調整、管理、評估,分析業務需求,改進方案不足,確保方案順利實施。
交通大數據架構師:設計、組合、搭建各種平臺架構,包括大數據文件系統層、數據存儲層、資源管理器和資源協調器層、計算框架層、數據分析層、數據集成層、操作框架層等,以確保大數據系統架構落地可行。
交通大數據分析師:基于各種分析手段對交通大數據進行分析、挖掘、展現并用于決策支持,如對數據統計結果的甄別與分析、對數據分析結果的評估與展示、對用戶數據需求的研判與反饋等。
交通大數據科學家:精通各種算法,利用數據作為資源,創新性運用數據處理和數據分析手段,為交通大數據提供算法支撐,挖掘數據潛力,創造數據價值,對交通運輸行業大數據進行科學決策和預測。
這是從技術層面或大數據業務落實層面而言的。除此之外,從大數據產業鏈或保證大數據產品商業價值實現的橫向面,也可將交通大數據人才劃分為交通大數據應用人才、交通大數據安全人才、交通大數據管理人才、交通大數據領軍人才等。
交通大數據專業技術人才如前面所說的從交通大數據規劃師到交通大數據科學家五類專業技術人才等,不再贅述。
交通大數據應用人才:指能夠把大數據知識、技術、技能等應用于交通運輸行業或交通運輸相關行業的社會生產實踐,將交通大數據轉化為產品和服務,以創造更大市場價值、經濟價值和社會價值的人才。
交通大數據安全人才:負責交通運輸行業大數據數據安全、數據管控、數據開放、數據分享和隱私保護等大數據全生命周期的全部安全問題的人才,包括數據采集、數據整合、數據提煉、數據挖掘、數據可視化、數據隱私、防止數據盜用和濫用、保護加密數據、阻止黑客攻擊、安全態勢判斷、安全檢測等環節。
交通大數據管理人才:對交通運輸大數據及相關業務進行計劃、決策、組織、領導、控制,保障大數據業務實現的復合型人才。
交通大數據領軍人才:在交通大數據技術、管理、應用等相關領域取得較大成就,產生較大影響,或具有獨特人格魅力,對交通大數據技術、應用、安全、管理等其他人才具有較大創新力、感召力、影響力的交通大數據領導人才。
上述各類人才在素質、知識、技能、能力、經驗、思想、品格等方面的具體要求,詳見第二章第二節“貴州交通大數據人才類別建設”中的具體內容。
和整體大數據發展階段一樣,目前,交通大數據的發展還處于初級階段,在交通運輸領域從事大數據工作的,除上述明確的交通大數據人才外,還有信息系統項目管理師、軟件工程師、網絡工程師、系統架構師、程序開發人員、統計分析人員、網絡安全人員、計算機專家、統計學家等大數據源生領域即計算機科學、統計學、信息系統管理學中的大量人才,他們在將來較長時期內都會是交通大數據領域的重要從業者。