官术网_书友最值得收藏!

  • 精通Spark數(shù)據(jù)科學(xué)
  • (美)安德魯·摩根 (英)安托萬(wàn)·阿門(mén)德 大衛(wèi)·喬治 馬修·哈利特
  • 1456字
  • 2021-01-15 16:45:31

作者簡(jiǎn)介

安德魯·摩根(Andrew Morgan)是數(shù)據(jù)戰(zhàn)略及其執(zhí)行方面的專家,在支持技術(shù)、系統(tǒng)架構(gòu)和實(shí)現(xiàn)數(shù)據(jù)科學(xué)方面擁有豐富的經(jīng)驗(yàn)。他在數(shù)據(jù)行業(yè)擁有20多年的經(jīng)驗(yàn),曾為一些久負(fù)盛名的公司及其全球客戶設(shè)計(jì)系統(tǒng)——通常是大型、復(fù)雜和國(guó)際性的項(xiàng)目。2013年,他創(chuàng)辦了數(shù)據(jù)科學(xué)和大數(shù)據(jù)工程咨詢公司ByteSumo,目前在與歐洲和美國(guó)的客戶進(jìn)行合作。Andrew是一位活躍的數(shù)據(jù)科學(xué)家,也是趨勢(shì)演算(TrendCalculus)算法的發(fā)明者。該算法是他為自己的研究項(xiàng)目而開(kāi)發(fā)的,該項(xiàng)目旨在研究基于機(jī)器學(xué)習(xí)的長(zhǎng)期預(yù)測(cè),這些預(yù)測(cè)可以在不斷變化的文化、地緣政治和經(jīng)濟(jì)趨勢(shì)中發(fā)現(xiàn)規(guī)律。他還是Hadoop Summit EU數(shù)據(jù)科學(xué)委員會(huì)的成員,并在許多會(huì)議上就各種數(shù)據(jù)主題發(fā)表過(guò)演講。他也活躍于他的居住地倫敦的數(shù)據(jù)科學(xué)和大數(shù)據(jù)社區(qū)。

謹(jǐn)以本書(shū)獻(xiàn)給我的妻子Steffy、我的孩子Alice和Adele,以及我所有的朋友和同事,感謝他們一直支持著我。這本書(shū)也是為了紀(jì)念我在多倫多大學(xué)學(xué)習(xí)時(shí)的第一位導(dǎo)師——Ferenc Csillag教授。早在1994年,F(xiàn)erko就用未來(lái)愿景激勵(lì)我:我們可以使用全球范圍的數(shù)據(jù)集和復(fù)雜算法來(lái)監(jiān)測(cè)和優(yōu)化周遭的世界。這是一個(gè)改變我人生的信念,關(guān)于用大數(shù)據(jù)科學(xué)拯救世界的夢(mèng)想,我仍在追尋。

安托萬(wàn)·阿門(mén)德(Antoine Amend)是一位對(duì)大數(shù)據(jù)工程和可擴(kuò)展計(jì)算充滿熱情的數(shù)據(jù)科學(xué)家。這本書(shū)的主題是“折騰”天文數(shù)字量級(jí)的非結(jié)構(gòu)化數(shù)據(jù)以獲得新的見(jiàn)解,這主要源于Antoine的理論物理學(xué)背景。他于2008年畢業(yè)并獲得天體物理學(xué)碩士學(xué)位。在Hadoop的早期階段,在大數(shù)據(jù)的概念普及之前,他曾在瑞士的一家大型咨詢公司工作。從那時(shí)起,他就開(kāi)始接觸大數(shù)據(jù)技術(shù)?,F(xiàn)在他在巴克萊銀行擔(dān)任網(wǎng)絡(luò)安全數(shù)據(jù)科學(xué)部門(mén)的主管。通過(guò)將科學(xué)方法與核心IT技能相結(jié)合,Antoine連續(xù)兩年獲得了在得克薩斯州奧斯汀舉行的大數(shù)據(jù)世界錦標(biāo)賽決賽資格。他在2014年和2015年都名列前12位(超過(guò)2 000多名競(jìng)爭(zhēng)對(duì)手),這兩次比賽中他還使用了本書(shū)介紹的方法和技術(shù)贏得了創(chuàng)新獎(jiǎng)。

我要感謝我的妻子伴我同行,她一直是我不斷增進(jìn)知識(shí)和推動(dòng)事業(yè)發(fā)展的動(dòng)力。另外,還要感謝我的孩子們,他們教會(huì)我如何在必要時(shí)放松心情并獲得新的想法。

我要感謝同事們,特別是Samuel Assefa博士、Eirini Spyropoulou博士和Will Hardman,他們耐心傾聽(tīng)我的“瘋狂”理論。還要感謝過(guò)去幾年有幸與之合作的其他人。最后,我想特別感謝以前的經(jīng)理和導(dǎo)師,他們幫助我在數(shù)據(jù)科學(xué)的職業(yè)生涯中順利發(fā)展,謝謝Manu、Toby、Gary和Harry。

大衛(wèi)·喬治(David George)是一位杰出的分布式計(jì)算專家,擁有超過(guò)15年的數(shù)據(jù)系統(tǒng)從業(yè)經(jīng)驗(yàn),主要服務(wù)于全球聞名的IT咨詢機(jī)構(gòu)和品牌。他很早以前就開(kāi)始使用Hadoop核心技術(shù),并做過(guò)大規(guī)模的實(shí)施。David總是采用務(wù)實(shí)的方法進(jìn)行軟件設(shè)計(jì),并重視簡(jiǎn)約中的優(yōu)雅。

如今,他繼續(xù)作為首席工程師為金融行業(yè)客戶設(shè)計(jì)可擴(kuò)展的應(yīng)用,并滿足一些較為嚴(yán)苛的需求。他的新項(xiàng)目側(cè)重于采用先進(jìn)的人工智能技術(shù)來(lái)提高知識(shí)產(chǎn)業(yè)的自動(dòng)化水平。

本書(shū)獻(xiàn)給Ellie、Shannon、Pauline和Pumpkin等人,此處無(wú)法一一列出了!

馬修 · 哈利特(Matthew Hallett)是一名軟件工程師和計(jì)算機(jī)科學(xué)家,擁有超過(guò)15年的從業(yè)經(jīng)驗(yàn)。他是一名面向?qū)ο蟮摹皩<壹?jí)程序員”和系統(tǒng)工程師,擁有豐富的底層編程范式知識(shí)。在過(guò)去的幾年里,他在Hadoop和關(guān)鍵業(yè)務(wù)環(huán)境中的分布式編程方面積累了豐富的專業(yè)知識(shí),這些環(huán)境由數(shù)千節(jié)點(diǎn)的數(shù)據(jù)中心組成。Matthew在分布式算法和分布式計(jì)算體系結(jié)構(gòu)的實(shí)施方面擁有多種語(yǔ)言的咨詢經(jīng)驗(yàn),目前是“四大審計(jì)公司”數(shù)據(jù)科學(xué)與工程團(tuán)隊(duì)的數(shù)據(jù)工程師顧問(wèn)。

感謝Lynnie的理解和支持,讓我有時(shí)間在深夜、周末和假期寫(xiě)這本書(shū)。也感謝Nugget讓本書(shū)變得有價(jià)值。

還要感謝Gary Richardson、David Pryce博士、Helen Ramsden博士、Sima Reichenbach博士和Fabio Petroni博士提供的寶貴建議和指導(dǎo),這些建議和指導(dǎo)為本書(shū)的完成提供了幫助——如果沒(méi)有他們的幫助和貢獻(xiàn),這本書(shū)可能永遠(yuǎn)無(wú)法完成!

主站蜘蛛池模板: 河津市| 大竹县| 宜黄县| 安康市| 高台县| 永州市| 新建县| 高安市| 凤城市| 隆化县| 大关县| 黔西| 郯城县| 吉木乃县| 陆良县| 宁乡县| 新绛县| 津市市| 吐鲁番市| 微山县| 昭苏县| 海盐县| 松原市| 凤凰县| 文昌市| 林西县| 南漳县| 剑阁县| 类乌齐县| 赤城县| 泗阳县| 遂平县| 广安市| 灌阳县| 祁东县| 洞口县| 泰州市| 岑溪市| 阳谷县| 三门县| 探索|