- 大數(shù)據(jù)技術(shù)原理與應(yīng)用(第2版)
- 林子雨編著
- 5711字
- 2019-07-30 13:20:23
1.3 大數(shù)據(jù)的影響
大數(shù)據(jù)對(duì)科學(xué)研究、思維方式和社會(huì)發(fā)展都具有重要而深遠(yuǎn)的影響。在科學(xué)研究方面,大數(shù)據(jù)使得人類科學(xué)研究在經(jīng)歷了實(shí)驗(yàn)、理論、計(jì)算3種范式之后,迎來了第四種范式——數(shù)據(jù);在思維方式方面,大數(shù)據(jù)具有“全樣而非抽樣、效率而非精確、相關(guān)而非因果”三大顯著特征,完全顛覆了傳統(tǒng)的思維方式;在社會(huì)發(fā)展方面,大數(shù)據(jù)決策逐漸成為一種新的決策方式,大數(shù)據(jù)應(yīng)用有力促進(jìn)了信息技術(shù)與各行業(yè)的深度融合,大數(shù)據(jù)開發(fā)大大推動(dòng)了新技術(shù)和新應(yīng)用的不斷涌現(xiàn);在就業(yè)市場(chǎng)方面,大數(shù)據(jù)的興起使得數(shù)據(jù)科學(xué)家成為熱門人才;在人才培養(yǎng)方面,大數(shù)據(jù)的興起將在很大程度上改變我國(guó)高校信息技術(shù)相關(guān)專業(yè)的現(xiàn)有教學(xué)和科研體制。
1.3.1 大數(shù)據(jù)對(duì)科學(xué)研究的影響
圖靈獎(jiǎng)獲得者、著名數(shù)據(jù)庫(kù)專家吉姆·格雷(Jim Gray)博士觀察并總結(jié)認(rèn)為,人類自古以來在科學(xué)研究上先后歷經(jīng)了實(shí)驗(yàn)、理論、計(jì)算和數(shù)據(jù)四種范式(見圖1-6),具體如下。
1.第一種范式:實(shí)驗(yàn)科學(xué)
在最初的科學(xué)研究階段,人類采用實(shí)驗(yàn)來解決一些科學(xué)問題,著名的比薩斜塔實(shí)驗(yàn)就是一個(gè)典型實(shí)例。1590年,伽利略在比薩斜塔上做了“兩個(gè)鐵球同時(shí)落地”的實(shí)驗(yàn),得出了重量不同的兩個(gè)鐵球同時(shí)下落的結(jié)論,從此推翻了亞里士多德“物體下落速度和重量成比例”的學(xué)說,糾正了這個(gè)持續(xù)了1 900年之久的錯(cuò)誤結(jié)論。

圖1-6 科學(xué)研究的4種范式
2.第二種范式:理論科學(xué)
實(shí)驗(yàn)科學(xué)的研究會(huì)受到當(dāng)時(shí)實(shí)驗(yàn)條件的限制,難以完成對(duì)自然現(xiàn)象更精確的理解。隨著科學(xué)的進(jìn)步,人類開始采用各種數(shù)學(xué)、幾何、物理等理論,構(gòu)建問題模型和解決方案。比如,牛頓第一定律、牛頓第二定律、牛頓第三定律構(gòu)成了牛頓力學(xué)的完整體系,奠定了經(jīng)典力學(xué)的概念基礎(chǔ),它的廣泛傳播和運(yùn)用對(duì)人們的生活和思想產(chǎn)生了重大影響,在很大程度上推動(dòng)了人類社會(huì)的發(fā)展與進(jìn)步。
3.第三種范式:計(jì)算科學(xué)
隨著1946年人類歷史上第一臺(tái)計(jì)算機(jī)ENIAC的誕生,人類社會(huì)開始步入計(jì)算機(jī)時(shí)代,科學(xué)研究也進(jìn)入了一個(gè)以“計(jì)算”為中心的全新時(shí)期。在實(shí)際應(yīng)用中,計(jì)算科學(xué)主要用于對(duì)各個(gè)科學(xué)問題進(jìn)行計(jì)算機(jī)模擬和其他形式的計(jì)算。通過設(shè)計(jì)算法并編寫相應(yīng)程序輸入計(jì)算機(jī)運(yùn)行,人類可以借助于計(jì)算機(jī)的高速運(yùn)算能力去解決各種問題。計(jì)算機(jī)具有存儲(chǔ)容量大、運(yùn)算速度快、精度高、可重復(fù)執(zhí)行等特點(diǎn),是科學(xué)研究的利器,推動(dòng)了人類社會(huì)的飛速發(fā)展。
4.第四種范式:數(shù)據(jù)密集型科學(xué)
隨著數(shù)據(jù)的不斷累積,其寶貴價(jià)值日益得到體現(xiàn),物聯(lián)網(wǎng)和云計(jì)算的出現(xiàn),更是促成了事物發(fā)展從量變到質(zhì)變的轉(zhuǎn)變,使人類社會(huì)開啟了全新的大數(shù)據(jù)時(shí)代。這時(shí),計(jì)算機(jī)將不僅僅能做模擬仿真,還能進(jìn)行分析總結(jié),得到理論。在大數(shù)據(jù)環(huán)境下,一切將以數(shù)據(jù)為中心,從數(shù)據(jù)中發(fā)現(xiàn)問題、解決問題,真正體現(xiàn)數(shù)據(jù)的價(jià)值。大數(shù)據(jù)將成為科學(xué)工作者的寶藏,從數(shù)據(jù)中可以挖掘未知模式和有價(jià)值的信息,服務(wù)于生產(chǎn)和生活,推動(dòng)科技創(chuàng)新和社會(huì)進(jìn)步。雖然第三種方式和第四種方式都是利用計(jì)算機(jī)來進(jìn)行計(jì)算,但是二者還是有本質(zhì)的區(qū)別的。在第三種研究范式中,一般是先提出可能的理論,再搜集數(shù)據(jù),然后通過計(jì)算來驗(yàn)證。而對(duì)于第四種研究范式,則是先有了大量已知的數(shù)據(jù),然后通過計(jì)算得出之前未知的理論。
1.3.2 大數(shù)據(jù)對(duì)思維方式的影響
維克托·邁爾·舍恩伯格在《大數(shù)據(jù)時(shí)代:生活、工作與思維的大變革》一書中明確指出,大數(shù)據(jù)時(shí)代最大的轉(zhuǎn)變就是思維方式的3種轉(zhuǎn)變:全樣而非抽樣、效率而非精確、相關(guān)而非因果。
1.全樣而非抽樣
過去,由于數(shù)據(jù)存儲(chǔ)和處理能力的限制,在科學(xué)分析中,通常采用抽樣的方法,即從全集數(shù)據(jù)中抽取一部分樣本數(shù)據(jù),通過對(duì)樣本數(shù)據(jù)的分析來推斷全集數(shù)據(jù)的總體特征。通常,樣本數(shù)據(jù)規(guī)模要比全集數(shù)據(jù)小很多,因此,可以在可控的代價(jià)內(nèi)實(shí)現(xiàn)數(shù)據(jù)分析的目的。現(xiàn)在,我們已經(jīng)迎來大數(shù)據(jù)時(shí)代,大數(shù)據(jù)技術(shù)的核心就是海量數(shù)據(jù)的存儲(chǔ)和處理,分布式文件系統(tǒng)和分布式數(shù)據(jù)庫(kù)技術(shù)提供了理論上近乎無限的數(shù)據(jù)存儲(chǔ)能力,分布式并行編程框架MapReduce提供了強(qiáng)大的海量數(shù)據(jù)并行處理能力。因此,有了大數(shù)據(jù)技術(shù)的支持,科學(xué)分析完全可以直接針對(duì)全集數(shù)據(jù)而不是抽樣數(shù)據(jù),并且可以在短時(shí)間內(nèi)迅速得到分析結(jié)果,速度之快,超乎我們的想象。就像前面我們已經(jīng)提到過的,谷歌公司的Dremel可以在2~3s內(nèi)完成PB級(jí)別數(shù)據(jù)的查詢。
2.效率而非精確
過去,我們?cè)诳茖W(xué)分析中采用抽樣分析方法,就必須追求分析方法的精確性,因?yàn)槌闃臃治鲋皇轻槍?duì)部分樣本的分析,其分析結(jié)果被應(yīng)用到全集數(shù)據(jù)以后,誤差會(huì)被放大,這就意味著,抽樣分析的微小誤差被放大到全集數(shù)據(jù)以后,可能會(huì)變成一個(gè)很大的誤差。因此,為了保證誤差被放大到全集數(shù)據(jù)時(shí)仍然處于可以接受的范圍,就必要確保抽樣分析結(jié)果的精確性。正是由于這個(gè)原因,傳統(tǒng)的數(shù)據(jù)分析方法往往更加注重提高算法的精確性,其次才是提高算法效率。現(xiàn)在,大數(shù)據(jù)時(shí)代采用全樣分析而不是抽樣分析,全樣分析結(jié)果就不存在誤差被放大的問題。因此,追求高精確性已經(jīng)不是其首要目標(biāo);相反,大數(shù)據(jù)時(shí)代具有“秒級(jí)響應(yīng)”的特征,要求在幾秒內(nèi)就迅速給出針對(duì)海量數(shù)據(jù)的實(shí)時(shí)分析結(jié)果,否則就會(huì)喪失數(shù)據(jù)的價(jià)值,因此,數(shù)據(jù)分析的效率成為關(guān)注的核心。
3.相關(guān)而非因果
過去,數(shù)據(jù)分析的目的,一方面是解釋事物背后的發(fā)展機(jī)理,比如,一個(gè)大型超市在某個(gè)地區(qū)的連鎖店在某個(gè)時(shí)期內(nèi)凈利潤(rùn)下降很多,這就需要IT部門對(duì)相關(guān)銷售數(shù)據(jù)進(jìn)行詳細(xì)分析找出發(fā)生問題的原因;另一方面是用于預(yù)測(cè)未來可能發(fā)生的事件,比如,通過實(shí)時(shí)分析微博數(shù)據(jù),當(dāng)發(fā)現(xiàn)人們對(duì)霧霾的討論明顯增加時(shí),就可以建議銷售部門增加口罩的進(jìn)貨量,因?yàn)槿藗冴P(guān)注霧霾的一個(gè)直接結(jié)果是,大家會(huì)想到購(gòu)買一個(gè)口罩來保護(hù)自己的身體健康。不管是哪個(gè)目的,其實(shí)都反映了一種“因果關(guān)系”。但是,在大數(shù)據(jù)時(shí)代,因果關(guān)系不再那么重要,人們轉(zhuǎn)而追求“相關(guān)性”而非“因果性”。比如,我們?nèi)ヌ詫毦W(wǎng)購(gòu)物時(shí),當(dāng)我們購(gòu)買了一個(gè)汽車防盜鎖以后,淘寶網(wǎng)還會(huì)自動(dòng)提示你,與你購(gòu)買相同物品的其他客戶還購(gòu)買了汽車坐墊,也就是說,淘寶網(wǎng)只會(huì)告訴你“購(gòu)買汽車防盜鎖”和“購(gòu)買汽車坐墊”之間存在相關(guān)性,但是并不會(huì)告訴你為什么其他客戶購(gòu)買了汽車防盜鎖以后還會(huì)購(gòu)買汽車坐墊。
1.3.3 大數(shù)據(jù)對(duì)社會(huì)發(fā)展的影響
大數(shù)據(jù)將會(huì)對(duì)社會(huì)發(fā)展產(chǎn)生深遠(yuǎn)的影響,具體表現(xiàn)在以下幾個(gè)方面:大數(shù)據(jù)決策成為一種新的決策方式,大數(shù)據(jù)應(yīng)用促進(jìn)信息技術(shù)與各行業(yè)的深度融合,大數(shù)據(jù)開發(fā)推動(dòng)新技術(shù)和新應(yīng)用的不斷涌現(xiàn)。
1.大數(shù)據(jù)決策成為一種新的決策方式
根據(jù)數(shù)據(jù)制定決策,并非大數(shù)據(jù)時(shí)代所特有。從20世紀(jì)90年代開始,數(shù)據(jù)倉(cāng)庫(kù)和商務(wù)智能工具就開始大量用于企業(yè)決策。發(fā)展到今天,數(shù)據(jù)倉(cāng)庫(kù)已經(jīng)是一個(gè)集成的信息存儲(chǔ)倉(cāng)庫(kù),既具備批量和周期性的數(shù)據(jù)加載能力,也具備數(shù)據(jù)變化的實(shí)時(shí)探測(cè)、傳播和加載能力,并能結(jié)合歷史數(shù)據(jù)和實(shí)時(shí)數(shù)據(jù)實(shí)現(xiàn)查詢分析和自動(dòng)規(guī)則觸發(fā),從而提供對(duì)戰(zhàn)略決策(如宏觀決策和長(zhǎng)遠(yuǎn)規(guī)劃等)和戰(zhàn)術(shù)決策(如實(shí)時(shí)營(yíng)銷和個(gè)性化服務(wù)等)的雙重支持。但是,數(shù)據(jù)倉(cāng)庫(kù)以關(guān)系數(shù)據(jù)庫(kù)為基礎(chǔ),無論是數(shù)據(jù)類型還是數(shù)據(jù)量方面都存在較大的限制。現(xiàn)在,大數(shù)據(jù)決策可以面向類型繁多的、非結(jié)構(gòu)化的海量數(shù)據(jù)進(jìn)行決策分析,已經(jīng)成為受到追捧的全新決策方式。比如,政府部門可以把大數(shù)據(jù)技術(shù)融入“輿情分析”,通過對(duì)論壇、微博、微信、社區(qū)等多種來源數(shù)據(jù)進(jìn)行綜合分析,弄清或測(cè)驗(yàn)信息中本質(zhì)性的事實(shí)和趨勢(shì),揭示信息中含有的隱性情報(bào)內(nèi)容,對(duì)事物發(fā)展做出情報(bào)預(yù)測(cè),協(xié)助實(shí)現(xiàn)政府決策,有效應(yīng)對(duì)各種突發(fā)事件。
2.大數(shù)據(jù)應(yīng)用促進(jìn)信息技術(shù)與各行業(yè)的深度融合
有專家指出,大數(shù)據(jù)將會(huì)在未來10年改變幾乎每一個(gè)行業(yè)的業(yè)務(wù)功能。互聯(lián)網(wǎng)、銀行、保險(xiǎn)、交通、材料、能源、服務(wù)等行業(yè)領(lǐng)域,不斷累積的大數(shù)據(jù)將加速推進(jìn)這些行業(yè)與信息技術(shù)的深度融合,開拓行業(yè)發(fā)展的新方向。比如,大數(shù)據(jù)可以幫助快遞公司選擇運(yùn)費(fèi)成本最低的最佳行車路徑,協(xié)助投資者選擇收益最大化的股票投資組合,輔助零售商有效定位目標(biāo)客戶群體,幫助互聯(lián)網(wǎng)公司實(shí)現(xiàn)廣告精準(zhǔn)投放,還可以讓電力公司做好配送電計(jì)劃確保電網(wǎng)安全等。總之,大數(shù)據(jù)所觸及的每個(gè)角落,我們的社會(huì)生產(chǎn)和生活都會(huì)因之而發(fā)生巨大且深刻的變化。
3.大數(shù)據(jù)開發(fā)推動(dòng)新技術(shù)和新應(yīng)用的不斷涌現(xiàn)
大數(shù)據(jù)的應(yīng)用需求是大數(shù)據(jù)新技術(shù)開發(fā)的源泉。在各種應(yīng)用需求的強(qiáng)烈驅(qū)動(dòng)下,各種突破性的大數(shù)據(jù)技術(shù)將被不斷提出并得到廣泛應(yīng)用,數(shù)據(jù)的能量也將不斷得到釋放。在不遠(yuǎn)的將來,原來那些依靠人類自身判斷力的領(lǐng)域應(yīng)用,將逐漸被各種基于大數(shù)據(jù)的應(yīng)用所取代。比如,今天的汽車保險(xiǎn)公司,只能憑借少量的車主信息,對(duì)客戶進(jìn)行簡(jiǎn)單類別劃分,并根據(jù)客戶的汽車出險(xiǎn)次數(shù)給予相應(yīng)的保費(fèi)優(yōu)惠方案,客戶選擇哪家保險(xiǎn)公司都沒有太大差別。隨著車聯(lián)網(wǎng)的出現(xiàn),“汽車大數(shù)據(jù)”將會(huì)深刻改變汽車保險(xiǎn)業(yè)的商業(yè)模式,如果某家商業(yè)保險(xiǎn)公司能夠獲取客戶車輛的相關(guān)細(xì)節(jié)信息,并利用事先構(gòu)建的數(shù)學(xué)模型對(duì)客戶等級(jí)進(jìn)行更加細(xì)致的判定,給予更加個(gè)性化的“一對(duì)一”優(yōu)惠方案,那么毫無疑問,這家保險(xiǎn)公司將具備明顯的市場(chǎng)競(jìng)爭(zhēng)優(yōu)勢(shì),獲得更多客戶的青睞。
1.3.4 大數(shù)據(jù)對(duì)就業(yè)市場(chǎng)的影響
大數(shù)據(jù)的興起使得數(shù)據(jù)科學(xué)家成為熱門人才。2010年的時(shí)候,在高科技勞動(dòng)力市場(chǎng)上還很難見到數(shù)據(jù)科學(xué)家的頭銜,但此后,數(shù)據(jù)科學(xué)家逐漸發(fā)展成為市場(chǎng)上最熱門的職位之一,具有廣闊發(fā)展前景,并代表著未來的發(fā)展方向。
互聯(lián)網(wǎng)企業(yè)和零售、金融類企業(yè)都在積極爭(zhēng)奪大數(shù)據(jù)人才,數(shù)據(jù)科學(xué)家成為大數(shù)據(jù)時(shí)代最緊缺的人才。據(jù)麥肯錫預(yù)測(cè),到2018年,僅美國(guó)本土就可能缺少14萬~19萬個(gè)具備數(shù)據(jù)深入分析能力的專業(yè)人員,能夠通過分析大數(shù)據(jù)支撐企業(yè)做出有效決策的數(shù)據(jù)管理人員和分析師,也大概存在150萬人的缺口。國(guó)內(nèi)有大數(shù)據(jù)專家估算過,5年內(nèi)國(guó)內(nèi)的大數(shù)據(jù)人才缺口會(huì)達(dá)到130萬,以大數(shù)據(jù)應(yīng)用較多的互聯(lián)網(wǎng)金融為例,這一行業(yè)每年增速達(dá)到4倍,屆時(shí),僅互聯(lián)網(wǎng)金融需要的大數(shù)據(jù)人才就是現(xiàn)在需求的4倍以上。與此同時(shí),大數(shù)據(jù)人才的薪資水平也在“水漲船高”,根據(jù)第四屆中國(guó)貴州人才博覽會(huì)發(fā)布的《全國(guó)大數(shù)據(jù)人才需求指數(shù)報(bào)告》,2016年2月份貴陽大數(shù)據(jù)人才月薪已逼近8 000元。
根據(jù)中橋調(diào)研咨詢2013年7月針對(duì)中國(guó)市場(chǎng)的一次調(diào)研結(jié)果顯示,中國(guó)用戶目前還主要局限在結(jié)構(gòu)化數(shù)據(jù)分析方面,尚未進(jìn)入通過對(duì)半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行分析、捕捉新的市場(chǎng)空間的階段。但是,大數(shù)據(jù)中包含了大量的非結(jié)構(gòu)化數(shù)據(jù),未來將會(huì)產(chǎn)生大量針對(duì)非結(jié)構(gòu)化數(shù)據(jù)分析的市場(chǎng)需求,因此,未來中國(guó)市場(chǎng)對(duì)掌握大數(shù)據(jù)分析專業(yè)技能的數(shù)據(jù)科學(xué)家的需求會(huì)逐年遞增。
盡管有少數(shù)人認(rèn)為未來有更多的數(shù)據(jù)會(huì)采用自動(dòng)化處理,會(huì)逐步降低對(duì)數(shù)據(jù)科學(xué)家的需求,但是仍然有更多的人認(rèn)為,隨著數(shù)據(jù)科學(xué)家給企業(yè)所帶來的商業(yè)價(jià)值的日益體現(xiàn),市場(chǎng)對(duì)數(shù)據(jù)科學(xué)家的需求會(huì)越發(fā)旺盛。
1.3.5 大數(shù)據(jù)對(duì)人才培養(yǎng)的影響
大數(shù)據(jù)的興起將在很大程度上改變中國(guó)高校信息技術(shù)相關(guān)專業(yè)的現(xiàn)有教學(xué)和科研體制。一方面,數(shù)據(jù)科學(xué)家是一個(gè)需要掌握統(tǒng)計(jì)、數(shù)學(xué)、機(jī)器學(xué)習(xí)、可視化、編程等多方面知識(shí)的復(fù)合型人才,在中國(guó)高校現(xiàn)有的學(xué)科和專業(yè)設(shè)置中,上述專業(yè)知識(shí)分布在數(shù)學(xué)、統(tǒng)計(jì)和計(jì)算機(jī)等多個(gè)學(xué)科中,任何一個(gè)學(xué)科都只能培養(yǎng)某個(gè)方向的專業(yè)人才,無法培養(yǎng)全面掌握數(shù)據(jù)科學(xué)相關(guān)知識(shí)的復(fù)合型人才。另一方面,數(shù)據(jù)科學(xué)家需要大數(shù)據(jù)應(yīng)用實(shí)戰(zhàn)環(huán)境,在真正的大數(shù)據(jù)環(huán)境中不斷學(xué)習(xí)、實(shí)踐并融會(huì)貫通,將自身技術(shù)背景與所在行業(yè)業(yè)務(wù)需求進(jìn)行深度融合,從數(shù)據(jù)中發(fā)現(xiàn)有價(jià)值的信息,但是目前大多數(shù)高校還不具備這種培養(yǎng)環(huán)境,不僅缺乏大規(guī)模基礎(chǔ)數(shù)據(jù),也缺乏對(duì)領(lǐng)域業(yè)務(wù)需求的理解。鑒于上述兩個(gè)原因,目前國(guó)內(nèi)的數(shù)據(jù)科學(xué)家人才并不是由高校培養(yǎng)的,而主要是在企業(yè)實(shí)際應(yīng)用環(huán)境中通過邊工作邊學(xué)習(xí)的方式不斷成長(zhǎng)起來的,其中,互聯(lián)網(wǎng)領(lǐng)域集中了大多數(shù)的數(shù)據(jù)科學(xué)家人才。
在未來5~10年,市場(chǎng)對(duì)數(shù)據(jù)科學(xué)家的需求會(huì)日益增加,不僅互聯(lián)網(wǎng)企業(yè)需要數(shù)據(jù)科學(xué)家,類似金融、電信這樣的傳統(tǒng)企業(yè)在大數(shù)據(jù)項(xiàng)目中也需要數(shù)據(jù)科學(xué)家。由于高校目前尚未具備大量培養(yǎng)數(shù)據(jù)科學(xué)家的基礎(chǔ)和能力,傳統(tǒng)企業(yè)很可能會(huì)從互聯(lián)網(wǎng)行業(yè)“挖墻角”,來滿足企業(yè)發(fā)展對(duì)數(shù)據(jù)分析人才的需求,繼而造成用人成本高企,制約企業(yè)的成長(zhǎng)壯大。因此,高校應(yīng)該秉承“培養(yǎng)人才、服務(wù)社會(huì)”的理念,充分發(fā)揮科研和教學(xué)綜合優(yōu)勢(shì),培養(yǎng)一大批具備數(shù)據(jù)分析基礎(chǔ)能力的數(shù)據(jù)科學(xué)家,有效緩解數(shù)據(jù)科學(xué)家的市場(chǎng)缺口,為促進(jìn)經(jīng)濟(jì)社會(huì)發(fā)展做出更大貢獻(xiàn)。目前,國(guó)內(nèi)很多高校開始設(shè)立大數(shù)據(jù)專業(yè)或者開設(shè)大數(shù)據(jù)課程,加快推進(jìn)大數(shù)據(jù)人才培養(yǎng)體系的建立。2014年,中國(guó)科學(xué)院大學(xué)開設(shè)首個(gè)“大數(shù)據(jù)技術(shù)與應(yīng)用”專業(yè)方向,面向科研發(fā)展及產(chǎn)業(yè)實(shí)踐,培養(yǎng)信息技術(shù)與行業(yè)需求結(jié)合的復(fù)合型大數(shù)據(jù)人才;2014 年清華大學(xué)成立數(shù)據(jù)科學(xué)研究院,推出多學(xué)科交叉培養(yǎng)的大數(shù)據(jù)碩士項(xiàng)目;2015年10月,復(fù)旦大學(xué)大數(shù)據(jù)學(xué)院成立,在數(shù)學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)、生命科學(xué)、醫(yī)學(xué)、經(jīng)濟(jì)學(xué)、社會(huì)學(xué)、傳播學(xué)等多學(xué)科交叉融合的基礎(chǔ)上,聚焦大數(shù)據(jù)學(xué)科建設(shè)、研究應(yīng)用和復(fù)合型人才培養(yǎng);2016年9月,華東師范大學(xué)數(shù)據(jù)科學(xué)與工程學(xué)院成立,新設(shè)置的本科專業(yè)“數(shù)據(jù)科學(xué)與工程”,是華東師大除“計(jì)算機(jī)科學(xué)與技術(shù)”和“軟件工程”以外,第三個(gè)與計(jì)算機(jī)相關(guān)的本科專業(yè)。廈門大學(xué)于2013年開始在研究生層面開設(shè)大數(shù)據(jù)課程,并建設(shè)了國(guó)內(nèi)高校首個(gè)大數(shù)據(jù)課程公共服務(wù)平臺(tái)。
高校培養(yǎng)數(shù)據(jù)科學(xué)家人才需要采取“兩條腿”走路的策略,即“引進(jìn)來”和“走出去”。所謂“引進(jìn)來”,是指高校要加強(qiáng)與企業(yè)的緊密合作,從企業(yè)引進(jìn)相關(guān)數(shù)據(jù),為學(xué)生搭建起接近企業(yè)應(yīng)用實(shí)際的、仿真的大數(shù)據(jù)實(shí)戰(zhàn)環(huán)境,讓學(xué)生有機(jī)會(huì)理解企業(yè)業(yè)務(wù)需求和數(shù)據(jù)形式,為開展數(shù)據(jù)分析奠定基礎(chǔ),同時(shí)從企業(yè)引進(jìn)具有豐富實(shí)戰(zhàn)經(jīng)驗(yàn)的高級(jí)人才,承擔(dān)起數(shù)據(jù)科學(xué)家相關(guān)課程教學(xué)任務(wù),切實(shí)提高教學(xué)質(zhì)量、水平和實(shí)用性。所謂“走出去”,是指積極鼓勵(lì)和引導(dǎo)學(xué)生走出校園,進(jìn)入互聯(lián)網(wǎng)、金融、電信等具備大數(shù)據(jù)應(yīng)用環(huán)境的企業(yè)去開展實(shí)踐活動(dòng),同時(shí)努力加強(qiáng)產(chǎn)、學(xué)、研合作,創(chuàng)造條件讓高校教師參與到企業(yè)大數(shù)據(jù)項(xiàng)目中,實(shí)現(xiàn)理論知識(shí)與實(shí)際應(yīng)用的深層次融合,鍛煉高校教師的大數(shù)據(jù)實(shí)戰(zhàn)能力,為更好培養(yǎng)數(shù)據(jù)科學(xué)家人才奠定基礎(chǔ)。
在課程體系的設(shè)計(jì)上,高校應(yīng)該打破學(xué)科界限,設(shè)置跨院系跨學(xué)科的“組合課程”,由來自計(jì)算機(jī)、數(shù)學(xué)、統(tǒng)計(jì)等不同院系的教師構(gòu)建聯(lián)合教學(xué)師資力量,多方合作,共同培養(yǎng)具備大數(shù)據(jù)分析基礎(chǔ)能力的數(shù)據(jù)科學(xué)家,使其全面掌握包括數(shù)學(xué)、統(tǒng)計(jì)學(xué)、數(shù)據(jù)分析、商業(yè)分析和自然語言處理等在內(nèi)的系統(tǒng)知識(shí),具有獨(dú)立獲取知識(shí)的能力,并具有較強(qiáng)的實(shí)踐能力和創(chuàng)新意識(shí)。
- IoT Penetration Testing Cookbook
- Apache Hive Essentials
- 機(jī)器人智能運(yùn)動(dòng)規(guī)劃技術(shù)
- Zabbix Network Monitoring(Second Edition)
- 機(jī)器自動(dòng)化控制器原理與應(yīng)用
- 機(jī)艙監(jiān)測(cè)與主機(jī)遙控
- 具比例時(shí)滯遞歸神經(jīng)網(wǎng)絡(luò)的穩(wěn)定性及其仿真與應(yīng)用
- 云原生架構(gòu)進(jìn)階實(shí)戰(zhàn)
- Extending Ansible
- Hands-On SAS for Data Analysis
- 新世紀(jì)Photoshop CS6中文版應(yīng)用教程
- Web滲透技術(shù)及實(shí)戰(zhàn)案例解析
- Kubernetes Design Patterns and Extensions
- 圖像傳感器應(yīng)用技術(shù)
- iLike職場(chǎng)大學(xué)生就業(yè)指導(dǎo):C和C++方向