- 大數據:挖掘數據背后的真相
- (日)松本健太郎
- 734字
- 2020-07-22 18:43:15
序言
本書是為那些想學習數據科學卻不擅長數學,又不知道從哪里學起的人寫的超級入門書。
大家好!初次見面,非常感謝各位能夠對本書感興趣!我叫松本健太郎,在東京從事與營銷業務相關的數據分析工作,職業定位被稱為“數據分析師”。我平時的工作內容是分析消費者隱含的心理,看清他們的真正需求,并將分析結果寫成總結報告,所以也被稱為“數據科學家”。
本書的主題是“數據讀法”。數據讀法,并非簡單地把“1”讀作“1”,而是理解數據所具有的特征,并由此聯想到數據背后隱藏的真相,覺察出數據的失真感,有時還要趕到現場對數據所要表達的結論做出解讀。說到底,數據科學家的一大半工作都是在“解讀數據”。可能有人會把數據科學理解為利用統計學及最近流行的AI(人工智能)所開展的很高難的科學,其實這是人們的誤解。
所謂數據科學,并不是“統計學+AI”??茖W(science)的詞源是“知識”“知道”,但后來發生了一點轉變,是指建立在體系基礎之上的知識和經驗。因此,從廣義上來看,數據科學就是指“關于數據的學問”“利用數據了解事物是什么的學問”。因此,如果認為“數據科學=統計學+AI”,那就過于狹義了。雖然很多人學了數據科學,但因不擅長數學而備受挫折。我認為,他們很可能就是過于束縛在這個狹隘意義上了。
例如,需要具備推理能力、思考能力、看透事物的觀察能力和洞察能力等邏輯思考,也是“知道”的重要學問之一。這種學問體系就是數據科學,掌握了這個體系的人被稱為數據科學家。
通過本書,讀者能夠模擬體驗數據科學家平時都是如何讀取數據的。通過對數據的讀取,多少能夠掌握一些數據的處理方法,提高自己理解和分析數據的能力,能讓大家產生“從明天開始再好好學學數據科學”的想法,也就達到了我撰寫本書的目的了。
那么,就讓我們開始一起學習吧。
松本健太郎