官术网_书友最值得收藏!

引言

數據并不是一座座孤島

在大海中獨踞

每個數據點都像一塊小小的泥土

連接成整個模型

看到他美妙的詩句“沒有誰是一座孤島”被這樣改編,令人尊敬的詩人約翰·唐恩(John Donne)估計會氣得從墳墓里跳出來吧,但我真的無法找到更好的方式來表達具有語境和關系網絡的數據的本質。求知之路就在于發現這些關系并使其可見。

社會變遷和技術進步使得整個世界更具不確定性。正如另一位詩人 Luís de Cam?es(不是我的親戚)所說:“唯一不變的只有變化本身。”在處理不確定性的過程中,我們用技術產生和獲取海量的數據。近些年,這種做法曾經有多種不同的稱呼,現如今,我們將其稱為“大數據”。

獲取并存儲數據變成了目標,數據越多越好。但我們是不是沒有抓住要領?如果沒有相應的技能將它們轉化成真正有用的數據,那么就不再需要更多的數據了。我們要考慮需要這些數據的人將會如何使用它們,目的是什么。否則,繼續搜集無用的數據,將這些數字垃圾存儲在硬盤上一個被遺忘的文件夾中,是沒有任何意義的。等等,更糟糕的做法是,制成餅圖。

主站蜘蛛池模板: 桦川县| 沂水县| 关岭| 铜山县| 田东县| 东乡族自治县| 新野县| 神池县| 朝阳县| 芮城县| 墨竹工卡县| 玛沁县| 手机| 绥江县| 黄山市| 乌海市| 通道| 百色市| 桐梓县| 双流县| 湖北省| 宝山区| 两当县| 安阳市| 广灵县| 鹤峰县| 临潭县| 长宁区| 汝州市| 日喀则市| 大余县| 永善县| 环江| 息烽县| 谢通门县| 嘉荫县| 遂溪县| 英吉沙县| 巴彦县| 汉寿县| 凌源市|