官术网_书友最值得收藏!

一、“火爆”的大數據

說起數據類型,你可能腦海中第一個蹦出的詞就是“大數據”。幾年前,你可能會因為沒有聽說過這個詞而被鄙視“落伍”,今天就不會了。一個原因是沒聽過的人越來越少,另一個原因是大家太熟悉這個詞了,就不再覺得了解大數據是什么了不起的事情。

打開百度指數(一個反映網民在網絡上搜索關鍵詞的搜索量趨勢的免費工具)搜索關鍵詞“大數據”,可以清晰地看到它在國內的熱度趨勢(見圖1-4)。自2012年起,這個詞以燎原之勢火遍全國。到2018年,這個趨勢開始放緩,除偶爾因為特殊新聞事件導致的搜索量激增外,慢慢成為一個常態化的搜索量級。

圖1-4 百度指數搜索關鍵詞:大數據

這個概念最早在國內火起來,是因為美劇《紙牌屋》。有人甚至用“巫術一般的精準”來形容在這個劇的創作過程中,大數據起到的作用。

據說,《紙牌屋》的數據庫擁有超過3000萬用戶的收視選擇數據,還有幾百萬條評論和主題搜索數據等。節目拍什么、誰來拍、誰來演、怎么播,都是基于對這些數據的分析統計來決定的。無論是用戶研究、內容偏好,還是內容轉化,都有數據的引導,從而實現了內容創造的C2B(Customer to Business),也就是“由用戶需求決定內容生產”。

這個在當時看來神奇、神秘又帶著高科技光環的故事瞬間點燃了這個概念的熱度。那段時間,打開知乎(一家網絡問答社區和內容創作平臺),大數據的問題俯拾皆是。很多不同行業的人士都紛紛提出了類似的問題:

游戲行業,大數據該如何應用?

大數據在金融行業有哪些應用前景?

大數據在石油行業可以干什么?

大數據在電信行業的應用目前的狀況如何?

大數據會如何改變管理咨詢行業?

大數據在鐵路行業的應用是什么?

大數據會對審計行業形成沖擊嗎?審計行業是否會因此而消失?

大數據對財務行業會產生什么樣的影響?

傳統行業如何搭建大數據團隊?

…………

不是“怎么用”,就是“未來會怎樣”,或者“如何搭建團隊”。

由于關注度居高不下,便出現了很多“蹭熱度”的行為。比如披著大數據的外衣來吸引眼球,其實只是用了“大量的數據”,東拼西湊了一些信息,推出一些似是而非的結論?;蛘叽蛑髷祿钠焯枺鋵嵵皇菫榱诵麄髯陨淼漠a品或品牌。

大數據之所以叫大數據,是因為它有五大特性,由IBM公司提出。這五大特性也稱為5V理論,是由五個以字母V開頭的單詞組成的,分別是:

? 大量(Volume),指數據量巨大。

? 高速(Velocity),指時效性很好。不像部分數據類型的獲取周期比較長,有的時候昨天產生的大數據,今天就能夠拿到。

? 多樣(Variety),指維度很多。有的數據類型只有單一維度或少量的分析維度,但大數據不僅數據量巨大,其中包含的維度也很多,方便大家進行多角度的分析思考。

? 價值(Value),指數據背后的分析價值和研究意義。

? 真實(Veracity),大數據都是基于自然產生的事實數據,這些數據原始不虛,沒有經過二次加工。

當數據同時具備這5個特性的時候,就可以稱之為大數據。比如說我們耳熟能詳的很多平臺,像阿里、騰訊、百度等,都是擁有大數據的。

以每年“雙十一”的淘寶數據為例,“雙十一”前后的平臺數據量是非常巨大的,絕對是“大量”的數據。它的時效性也很強,當天的數據,平臺很快就可以進行整體分析了,很“高速”。數據的維度也很多元,有銷量數據、熱門購買時間分布、價格趨勢、收藏趨勢、退貨數據等,是“多樣”的。數據的商業價值也毋庸置疑,你可以從中看到國人消費重點的變化,看到不同企業的產品興衰,看到不同品類的特點等,是有“價值”的。最后,這些都是源自用戶真實行為產生的數據,也就是事實數據,是“真實”的。

大數據本身固然價值非凡,但基于企業的需求和成本考慮,以及我看到的一些大數據“神話”的現象,我在這里想潑一點“冷水”。

以前面說到的《紙牌屋》為例。更準確一點的說法也許是:大數據分析是《紙牌屋》成功的必要條件,而非充分必要條件。與其說是大數據成就了《紙牌屋》,不如說是《紙牌屋》大大提高了“大數據”的影響力。

原因有以下三點。

首先,數據確實能幫助制作方了解用戶的過往內容偏好。但是用戶曾經喜歡不代表未來也會喜歡。未來有無數種可能性,人們未來的口味太難預估。到底拍什么樣的故事、選什么演員會火,依然需要制片方和導演的經驗、直覺,以及賭徒式的決斷。

其次,數據能夠幫助制作方實時了解用戶對已播劇集的喜好,從而優化未來的劇集內容。但是數據無法完全代替創意,再好的故事梗概如果遇上不好的內容編輯,依然會被埋沒。

最后,數據是“死”的,通過數據得出什么結論要靠人。同樣的數據,不同的人可能會得出完全不同的結論。因此,客觀存放在那里的數據,背后的價值能否被挖掘,以及能被挖掘出多少,也有很大的不確定性。

有的人會誤以為掌握海量數據就等于擁有了數據分析的能力,這是不對的。其實,就連《紙牌屋》的編劇約翰·曼凱維奇對中國用戶熱議的“紙牌屋通過大數據大獲成功”的觀點也覺得莫名其妙,并堅決否認。他曾在接受《北京青年報》采訪時明確表示:“一部劇的走紅,關乎導演、演員,更關乎有創意有深度的故事與講述故事的手法,但市場本身充滿了偶然性,并非數據能夠算出的?!?/p>

數據都是要靠“人”來分析的,就算是前面談到的螞蟻金服集團的“數據驅動業務”案例,前期的建模和迭代也依然要靠“人”來打好基礎。

大數據確實有用,但可能并沒有你想象中的“那么”有用。

主站蜘蛛池模板: 东城区| 八宿县| 繁昌县| 湘阴县| 台前县| 南华县| 珠海市| 孝昌县| 阿克陶县| 垫江县| 侯马市| 保靖县| 手机| 鄱阳县| 高陵县| 新乐市| 四平市| 阿拉善右旗| 罗甸县| 卢湾区| 赤水市| 丘北县| 重庆市| 林西县| 台中市| 侯马市| 微博| 通海县| 红安县| 嵊泗县| 香河县| 霍林郭勒市| 饶阳县| 玛曲县| 华容县| 腾冲县| 郧西县| 乌兰浩特市| 富宁县| 阜阳市| 尚义县|