官术网_书友最值得收藏!

●○●第1章 移動互聯網下的大數據

1.泛娛樂數據化變革

新時代——移動互聯網時代已經來臨。當你用iPhone 6 Plus砸核桃時,不小心將屏幕損壞了,你又希望再來一部iPhone 6 Plus,這時你并不需要去蘋果專賣店,你只需要登錄京東、亞馬遜等平臺下單即可。第二天你將收到一部新的iPhone 6 Plus,這樣你就可以繼續砸核桃了,當然這得你自己愿意。

經常在第三方購物的用戶會發現,我們買了一部iPhone 6 Plus后,再次登錄第三方平臺,我們會發現推薦的其他一些手機產品,如華為、小米、三星,甚至iPhone 4等。這就是大數據時代的低層次營銷。

因為你不可能繼續拿著iPhone 6 Plus砸核桃吧,短時間也不會換手機。不過如果半年后,再為您推薦手機,有可能正合您的心思。

大數據時代通過瀏覽或搜索記錄分析用戶下一步的需求,盡管還不是那么智能,但是這已經為我們提供了一個新的啟示。大數據時代,任何行業如果不主動參與其中,只能被動淘汰,泛娛樂就是大數據時代下新的一種產物。

泛娛樂指的是在移動互聯網場景下,通過技術手段實現多領域跨界連接。在這一過程中,需要打造一個核心IP(Intellectual Property的縮寫,直譯為知識產權。這是通過智力創造性勞動所獲得的成果,并且由智力勞動者對成果依法享有的專有權利)。這一IP可以是一本書、一個故事、一個視頻等,同時連接一切是泛娛樂的終極目標。

圖1.1 明星IP的組成要素

在2015年,業界認為互聯網發展的八大趨勢:車聯網、在線教育、大數據、在線視頻、泛娛樂、智能硬件、企業互聯網、互聯網金融。其中泛娛樂于2014年被文化部、新聞出版廣電總局等中央部委的行業報告收錄并重點提及。

騰訊旗下有兩大核心產品:QQ和微信。QQ用戶量超過8億,微信用戶量超過6億。目前騰訊是在中國的泛娛樂領域做得最出色的企業之一。其中在泛娛樂方面,騰訊互動娛樂表現得最為突出。騰訊娛樂將游戲、文學、動漫三者融為一體進行全方位的連接。

圖1.2 騰訊娛樂三位一體戰略布局

隨著騰訊在泛娛樂上不斷發力,目前騰訊已基本構建了一個打通游戲、文學、動漫、影視、戲劇等多種文創業務領域的互動娛樂新生態,初步打造了“同一明星IP、多種文化創意產品體驗”的創新業態。

除了騰訊之外,其他巨頭也紛紛加入其中。小米、華誼、阿里數娛、百度文學、藝動、通耀、360等企業紛紛將“泛娛樂”作為公司戰略大力推進。

是什么魔力讓互聯網行業與傳統行業紛紛向泛娛樂戰略示好?大數據。大數據為企業提供大量的參考信息,只需要借助技術優化就能得到精準的目標客戶數據。當客戶購買冰箱的時候,第三方平臺會主動為用戶推薦保鮮盒等,這一數據營銷優化,讓產品銷量提升,客戶也慢慢接受了。

麥肯錫曾專門對中小企業展開了一項調查研究,研究人員發現中小企業的數量占據所有企業的80%以上,而且所創造的GDP之和也非常巨大。由于中小企業的規模小,發展速度很快,但是資源較少,所以可以承受的營銷成本有限。

這一難題在大數據時代就會得到解決,由于獲得用戶數據的多樣性,企業很容易就能得到低價優質的用戶需求信息。目前中國擁有超過4000萬注冊的企業,對用戶的信息需求量很大,也很旺盛,如果通過大數據技術進行改進獲取用戶信息的方法,這將為企業節約數千億元。

在泛娛樂時代,借助大數據的力量,一切IP的打造就會變得容易,根本原因在于大數據的無窮力量。移動互聯網的許多場景都適用于泛娛樂場景。

在過去,人們往往關注于有形資產,而對無形資產則關注極少。而在大數據時代,價值分為兩種,第一是隱性資產數字價值,第二是顯性效果價值。對于傳統行業,對于隱性資源價值,一般都歸結為品牌知名度、美譽度,而在大數據時代,則附加了品牌與用戶共創的數字生態價值,這一價值促進了IP升值。

騰訊動漫的一款人氣漫畫《尸兄》以5000萬元天價將IP進行轉讓,迅速占據IP界話題熱點頭條?!妒帧肥琴Z海波(筆名七度魚)創作的作品,是騰訊動漫獨家簽約的漫畫。該作品自2011年12月6日上線以來,截至2014年3月29日,《尸兄》點擊量在線突破30億。這一優質IP迎來了泛娛樂熱潮,《尸兄》被改編成同名動畫《尸兄》(第一季)和《我叫白小飛》(第二季),以及網絡小說《尸兄》。各參與方賺得盆滿缽滿,作為話題熱點令各界討論至今。

顯然,《尸兄》實現了在泛娛樂場景之下隱性資產數字價值的變現過程。其實,隱性資產數字價值的高低源于對核心IP的挖掘深度與廣度,如果核心IP能打通眾多領域之間的壁壘,那么其IP價值會很高,這也是許多企業紛紛投入上千萬元甚至上億元去購買IP的原因。

2.大數據的摩爾定律

2015年4月19日這一天,正好是摩爾定律這一現象發現的五十周年紀念日。當工程師戈登·摩爾在半個世紀前提出這一定律的時候,電腦還像冰箱那樣笨重。如今,摩爾定律已經成為了整個硅谷的基石。

摩爾定律是一個物理和自然概念,揭示了信息技術進步的速度,其主要內容是在價格保持不變的情況下,每隔18~24個月,集成電路的性能(以集成電路芯片中可容納的晶體管數量衡量)就增加一倍,電腦性能也將提升一倍。換一句話說,每隔18~24個月,同樣性能的集成電路的價格就下降一半。

美國芯片接口技術開發商蘭巴斯公司的首席科學家克拉格·漢姆佩爾說:“摩爾定律是整個信息時代的驅動力,沒有摩爾定律,就沒有如今廉價的處理器,如今硅谷99%的公司也就不會存在了。多虧有了摩爾定律,我們今天才能把智能手機放在口袋或錢包里,今天智能手機的性能比1965—1995年里最大的電腦還要強勁。沒有摩爾定律就沒有超薄筆記本電腦,也不可能產生足以繪制整個基因組或是設計復雜藥物的高性能計算機。流媒體視頻、社交媒體、搜索功能、云計算——沒有摩爾定律,這些都不可能產生。”

摩爾定律影響著整個信息產業和電子產業。這一定律引發的結果之一是:隨著信息技術的發展,工程師和科學家將以前所未有的速度捕捉、分析并存儲數據,而尖端科技產品的成本也會越來越低,低到逐漸能夠為普通大眾所接受。

摩爾定律由英特爾公司創始人戈登·摩爾提出,并以他的名字命名。不過,最早提出摩爾定律相關內容的實際上是加州理工學院名譽教授卡沃·米德。卡沃·米德是半導體先驅,按照他的說法,“摩爾定律不是一個物理定律,它是人類本性的一個定律。人們知道什么在物理上是可能實現的,而且對之深信不疑。戈登和我一起共事,摩爾定律徹底地改變了我們的生活?!?/p>

任何想要忽視摩爾定律重要性的努力都是徒勞的,因為摩爾定律不僅直接導致了個人筆記本電腦、包括iPhone在內的智能手機、包括Apple Watch在內的電子產品以及特斯拉智能汽車的誕生,還是支撐谷歌、Facebook等科技巨頭的直接力量,僅這兩家公司就操縱著全球數十億美元級的廣告業務。

因此,說“摩爾定律是推動人類GDP增長的根本動力”這句話一點都不為過。也就是說,在過去的半個世紀里,摩爾定律推動集成電路技術以指數增長的速度進步,而這是人類社會之前從來沒有出現過的情況。從此,整個IT行業的技術革命正式開啟,全球自動化和信息化時代全面到來??偠灾谶^去的半個世紀里,拉動世界經濟增長的根本動力即為摩爾定律。

顯然,摩爾定律對人類的影響已經遠遠超出了今天我們所擁有的電子產品,甚至遠遠超出了制造出這些電子產品的眾多科技公司,其影響力已經觸及人類活動和創造的方方面面。更為重要的是,這種影響力才剛剛開始,盡管按照戈登·摩爾本人的說法,到了2020年,摩爾定律就會黯然失色。

在加州山景城計算機歷史博物館舉辦的“紀念摩爾定律提出五十周年”活動上,前英特爾公司高級主管比爾·戴維德和卡沃·米德向人們描繪了一幅壯觀的畫面,在未來數十年的時間里,摩爾定律不僅會繼續發揮其影響力,還將以一種更為宏大的方式顛覆整個人類的社會制度。

比爾·戴維德說:“每當科技變化發生之時,其所產生的社會影響都是十分巨大的。比如,從每小時3~4英里的馬車到每小時30英里的火車,創造了工業城市。社會和經濟變革是巨大的。50多年前,信息傳遞不僅緩慢,而且非常昂貴。所以我們把人們移動到距離信息很近的地方——沃爾瑪。現在,有了亞馬遜,可以把信息移動到人們所在的地方。由于摩爾定律,我們將會重建所有的物質性基礎設施。”

摩爾定律還帶來了另外兩個結果:互聯網的興起和產業的數字化,而正是這兩個結果的合力,誕生了一個過去一直沒有引起我們足夠重視的結果,即各種數據量的急劇增長。當數據量的增加累積到一定程度,量變就有可能發展為質變,即大數據。

通過使用大數據,谷歌的機器問答項目解決了30%左右的問題,已經遠遠超出了學術界迄今為止同類研究的最高水平。之所以提出大數據的概念,其根本原因是摩爾定律導致互聯網的發展,進而導致各種數據量的急劇增長。結果是數據增長的速度超過了互聯網的增長速度,如下圖所示:

圖1.3 摩爾定律導致數據增長速度超過互聯網增長速度

雖然大數據已經成為了一個熱門話題,但是,在行業里,人們對于它的理解依然停留在表層。主要表現在:在概念上認為大數據即數據量大,將大數據和大量數據相混淆,而忽視了大數據多維度和完備性的本質。在應用上只是看到了能夠利用統計規律提升公司業務,沒有看到大數據與摩爾定律的結合將帶來機器智能社會,徹底改變現有的商業模式和產業結構,以及人們的生活和工作方式。在評價上明顯低估了隨著大數據和機器智能的到來,人類社會將迎接和經受前所未有的機遇和沖擊。

3.Facebook平臺為泛娛樂帶來元數據

從總用戶10億到單日訪問10億,Facebook創始人與首席執行官說:“創立Facebook不僅僅是為了建立一家公司,更是為了實現連接世界的夢想?!笔聦嵣?,通過虛擬現實和Internet.org的發展,這家社交網絡公司已經讓地球上每七個人中的一人使用Facebook。而在2014年Facebook成立十周年大會上扎克伯格就曾豪言:“要在未來十年連接占全球人口三分之二的還未接入互聯網的人群?!?/p>

10年前,Facebook還只是扎克伯格在哈佛大學宿舍里創辦的一家小公司,如今,已經發展成為在加州門洛帕克市擁有自己的辦公園區全球最大的社交網絡。全球12.3億人都是Facebook的用戶。目前,公司市值約為1350億美元,而且很有可能成為史上最快達到1500億美元市值的公司。

短短10年,Facebook擴張速度如此之快,原因在于它的開放圖譜為泛娛樂提供元數據。所謂元數據(Metadata),簡而言之就是數據的數據,又稱為中介數據、中繼數據,元數據可以描述數據屬性的信息,為指示存儲位置、顯示歷史數據、查找相關資源、記錄個人和企業文件等功能提供支持。

正是借助Facebook的開放圖譜,超過900萬個應用得以在社交網絡平臺上分一杯羹,其中包括移動視頻社交網站Viddy、SocialCam、谷歌、環球音樂和索尼音樂合資的VEVO音樂服務網站等,都是其受益者,也證明了開放圖譜的價值。

開放圖譜的本質是一種數據收集和利用方式,通過抓取Facebook用戶在第三方服務上的數據,并反饋回Facebook機器,實現向所有在線的朋友分享全部信息的功能。例如,用戶可以將喜歡的數字媒體音樂服務平臺Spotify的音樂分享給他在Facebook上的朋友,所有的這些小碎片最終全部匯集到Facebook的動態更新,然后通過Facebook時間線,這個碎片會影響該用戶在Facebook上的其他朋友。

每天,Facebook在全球超過10億的用戶都會產生大量的數據,因此,Facebook不可能把所有的信息碎片都顯示在用戶個人的新聞動態中。不過,應用和網站開發者可以利用開放圖譜構建他們自己的數據,這樣,Facebook機器也可以將這些數據進行重新分類,同時有目的性地利用這些數據。

Facebook開放圖譜的總負責人麥克·凡爾納說:“我們可以借助傳統的文本分析來得出結果,但最后還是決定建立一個構架:開發者能夠明確告訴我們他應用的相關信息,這樣方便我們快速提煉出更有趣、更直觀的信息。”

應用開發者能夠在自己的網站上構建數據庫,那么Facebook就可以在開放圖譜上構建這些應用。來自全球第二大社交網站MySpace母公司Fox Interactive的一名員工安德里亞·奧恩說:“Facebook之所以能打敗MySpace,就是因為它能夠有效地管理數據,而且條理清楚?!?/p>

圖1.4 Facebook的開放圖譜

在Facebook上存儲著兩種數據:一種是目標數據,一種是對這種目標數據之間的關系進行描述的數據即元數據。麥克·凡爾納說:“在系統的頂層,我們支持開發者定義他們的目標數據,然后像整理一般用戶信息一樣對開發者目標數據進行歸類。”

這個系統主要從事兩方面的工作,一是分析能讓Facebook用戶感興趣的內容,二是根據分析結果選定對用戶、開發者特別重要的那部分內容。最后,通過匯總這兩個分析,Facebook機器決定新聞動態系、時間線,以及其他相關的系統顯示的內容。

“在網頁上,我們試圖分析你在尋找什么,比如奧巴馬有3000萬粉絲,如果你訪問他的主頁,我們會提示你的哪些朋友也喜歡他,我們做這個只需要幾毫秒?!?/p>

也許對于用戶來說,點擊這一行為并不具有特別重大的意義,也耗不了多少時間,不過對于Facebook來說,用戶在Facebook上的每一次點擊都值得軟件平臺Scribe實時記錄。通過另外一個接入Scrible的平臺對這些數據進行實時分析,Facebook機器能夠分析出最受歡迎以及最不受歡迎的內容。而所有這些記錄都會被存儲在Facebook的另一個數據庫里,之后顯示在新聞動態和時間線里。按照麥克·凡爾納團隊的實時監測,所有的數據從一個系統轉移到另一個系統,總耗時為20~30秒,而每個小時都會發生數億的轉移行為。這也因此保證了Facebook這個開放圖譜的高速運行。

Facebook坐擁的海量用戶數據,正是其賴以生存的基礎。而能夠玩轉這些大數據,才是Facebook成為社交網站霸主的真正原因。Facebook甚至能知道用戶是否或何時開始約會,以及何時分手。

圖1.5 Facebook基于用戶數據分析結果

上圖顯示了Facebook部分用戶的發帖數隨時間的變化。與傳統的線下確定戀愛關系的過程類似,通過社交網絡確立戀愛關系的雙方也會經歷一個所謂的“求愛”階段。根據Facebook科學家卡洛斯·迪烏克的分析,沿著時間軸觀察,在確定戀愛關系之前的100天里,雙方相互發帖數量呈現逐步增加的態勢。一直到戀情正式開始的“第0天”,之后越來越少。因為此時線上互動已經逐步給線下現實世界的互動讓位了。

早在2012年,Facebook的數據工程師們就已經開始利用用戶主動公開的感情數據,將情感關系與音樂進行融合,分析出用戶開始一段新感情時喜歡播放的歌曲,以及結束一段戀情后經常播放的歌曲。

除了將這些分析結果發布在平臺上,給用戶們帶去一些樂趣,Facebook的產品工程師們還將其用在基于數據的推薦引擎上,推出了新的社交服務——提供給用戶最契合心境的曲目。

此外,扎克伯格還希望Facebook能夠更加敏銳,在用戶還沒意識到問題之前就為用戶解決問題。在Facebook上,有5%到10%的帖子數是用戶向好友提出的問題,如推薦附近的印度餐廳,值得信賴的牙醫??梢?,扎克伯格正在引領Facebook進入谷歌的領域,不僅能夠為互聯網上的大部分問題提供可靠的答案,而且成為少數幾個擁有強大資源和意愿的公司,推進搜索的技術界限。

4.可預測票房成敗的谷歌

《愛在城南》(Southside With You)將于2016年在美國上映,這是一部獨立愛情劇情片,主角為美國總統奧巴馬與第一夫人米歇爾。劇情片以年輕的奧巴馬與頂頭上司米歇爾第一次約會為主線,設有冰淇淋屋前的初吻、逛街、聊天、看電影等情節,以此開啟兩人經典愛情之旅。

如果您是美國動漫行業巨頭,有意將《愛在城南》電影作為IP改編成動漫。IP方要求您支付該電影動漫版權1億美元,作為巨頭的你,買還是不買呢?在大數據面前,臆想等同于白日夢。買與不買的決定由谷歌幫你做。

如果你是《愛在城南》的發行方,營銷推廣費用是500萬美元還是5000萬美元呢?這也由谷歌為你做決定。

谷歌以搜索引擎起家,市值4294億美元(截至2015年8月3日),業務遍及大數據、“互聯網+”、工業4.0所涉及的幾乎所有高科技領域,對信息的挖掘更是走在世界的前列,預測票房就是一項新的功能。

2013年6月,谷歌的電影票房預測模型正式發布。谷歌宣稱,利用這個電影票房預測模型,能夠提前一個月對電影上映首周的票房收入進行預測,準確率高達94%,這一研究成果對于好萊塢電影公司具有重要意義,可以通過預測的票房狀況及時調整其電影營銷戰略。

其實,谷歌的票房預測模型并不神秘,主要基于在該搜索引擎上電影相關的搜索量與票房收入之間的關聯。隨著互聯網的發展,人們主要通過網絡搜索電影相關信息。因此,從本質上看,該模型是大數據分析技術在電影行業的重要應用。

根據谷歌白皮書(Quantifying Movie Magic with Google Search),電影票房收入與搜索量這兩條曲線的起伏變化具有極強的相似性。

圖1.6 票房收入與搜索量曲線

谷歌將電影的搜索分為兩大類:一類是涉及到電影名稱的搜索,另一類是不涉及電影名的搜索,如“熱門電影”“劇情片”“好萊塢電影”“奧斯卡獲獎影片”等。下圖顯示了票房收入與這兩種搜索量之間的關系。在一年中的大多數時間,涉及電影名的搜索量都高于不涉及電影名的搜索量。

不過圖中的灰色橢圓區域顯示了在電影淡季的時候,總體票房收入較低,而涉及電影名的搜索量會低于不涉及電影名的搜索量。因為此時一般缺乏知名度較高的電影,所以人們更傾向于用更寬泛的搜索找出想看的電影。

對于電影的網絡營銷,這一統計結果的意義是:處于電影旺季的時候,電影公司應該多購買涉及到具體的電影名和關鍵詞的廣告;而在電影淡季的時候,則應該多購買具有相對寬泛意義的關鍵詞的廣告。

圖1.7 票房收入與兩類不同搜索量之間的關系

由此可見,利用電影的搜索量對票房進行預測完全是可行的。不過,谷歌后來的研究表明,僅僅依靠搜索量對首周票房收入進行預測則是不夠可靠的。通過研究2012年上映的99部電影,谷歌嘗試著構建了一個線性模型,不過,這一次的準確率只有70%。如下圖:

圖1.8 搜索量與首周票房收入的關系

為了讓構建的預測模型精度更高,谷歌決定采用四大類指標:電影上映前一周的搜索量、電影廣告點擊量、上映影院數量、此前上映的同系列電影的票房表現。每一類指標之下又包含了多項小指標。

通過這四大類指標,谷歌可以構建一個線性回歸模型(Linear Regression Model),這是大數據分析領域里一個最基本的模型,基于票房收入與各類指標之間存在的簡單線性關系建立這些指標與票房收入的關系。

圖1.9 提前一周預測票房收入的效果

由上圖看出,預測的結果與實際的結果非常接近,提前一周預測的準確度為92%。不過,這一模型對電影營銷的價值并不大,因為在電影上映前一周幾乎不可能對營銷策略進行調整,也無法改善營銷效果。因此,谷歌開始了進一步的研究,使得這個預測模型能夠提前一個月進行首周票房的預測。

而要提前一個月進行電影票房預測,其關鍵在于谷歌采用的一項新指標——電影預告片的搜索量。根據谷歌的發現,與電影的直接搜索量相比,預告片的搜索量能夠更好地預測首周票房表現。因為在電影上映前一個月,人們了解電影更多地是通過搜索預告片。

除了電影預告片的搜索量,谷歌還將此前上映的同系列電影的票房表現,以及檔期的季節性特征引入票房預測模型,作為衡量指標,每一類指標之下也包含了其他小指標。谷歌再次構建了一個關于各類指標與票房收入之間關系的線性回歸模型。

下圖展示了提前一個月預測票房的模型效果,可見,預測結果的模型精度達到了94%,與實際結果非常接近。

圖1.10 提前一個月預測票房的效果

為什么谷歌采用了數據分析中最簡單的模型之一線性回歸模型,首先是因為利用簡單的線性模型就可以達到94%的準確度,在實際應用中具有很強的可操作性,也是人們一直追求的。其次,簡單的模型更容易為人們所理解和分析,這也是大數據分析技術的優勢,讓人們能夠從大量數據中挖掘出自己可以理解的規律,由此加深對整個行業的理解。正是利用如此簡單的線性預測模型,谷歌可以很容易地對各項指標帶來的影響進行分析。

谷歌的報告有這樣一個分析結論:“距離電影上映一周的時候,如果一部影片比同類影片多獲得25萬搜索量,那么該片的首周票房就很可能比同類影片高出430萬美元。若一部電影有搜索引擎廣告,我們也可以通過其廣告的點擊量來推測票房表現——如果點擊量超出同類電影2萬,那該片首周票房將領先750萬美元?!?/p>

如果能夠掌握各項指標對票房收入的影響,各大電影公司可以優化自身的營銷策略,同時有針對性的營銷,也可以降低營銷成本。根據谷歌的報告,用戶了解電影信息的渠道多達13個,利用票房預測模型,毫無疑問可以讓營銷策略的制定更為有效。

谷歌的電影預測模型展示了在電影行業大數據分析的成功運用。未來大數據分析的應用前景是,將模糊的行業經驗提升為科學、精準的量化指標。此前,谷歌還利用搜索數據對奧斯卡獲獎者進行預測。

影業如此,動漫、音樂、文學等泛娛樂表現形式也是如此。對前文所說的有意將《愛在城南》電影作為IP的美國動漫行業巨頭而言,大數據可以通過對《愛在城南》的票房預期,了解用戶的需求,推導動漫用戶的轉化率,進而估算動漫授權是值500萬美元還是5000萬美元。

當然在數據挖掘方面,不止谷歌一家,像Facebook、蘋果等都在行動。谷歌的這項挖掘用戶需求模型停留在表面分析,但大數據為深度挖掘用戶的需求提供了可能。

大數據的核心就是挖掘用戶需求信息,所以我們需要先知道用戶的哪些需求是可以從數據中挖掘到的,哪些需求是暫時不能挖掘出來的。因為并不是每一項需求都能被精準地挖掘到。利用大數據能挖掘出的用戶需求一般都是符合正常邏輯推理或行業經驗的。

泛娛樂時代的人們要想將大數據利用到其他行業,需要在三個方面做好探索:

第一,數據來源的種類。大數據時代的特點就是數據來源多樣,可以是像谷歌一樣的搜索引擎,也可以像Facebook一樣的社交平臺,當然也可以是游戲、動漫等產業。數據來源多樣決定了信息采集時要分清主要元素與全面元素,分清后才能保證用戶的潛在需求是精準的。

第二,大數據模型的選擇。從谷歌的模型,我們能得到搜索量等數據與票房收入的關系;從Netflix的模型,則挖掘了觀眾對不同電影的偏好,以及其他的行為特點。不同的數據模型會產生不同的結果,所以在模型選擇方面要以對商業決策最有利的模型為準。

第三,為大數據提供場景。從單一的數據分析中,往往我們會得到許多規律,但是有時我們并不需要這些規律,我們需要多數據的分析。因為這樣的多角度場景為分析提供了潛在的實際價值。

第四,大數據刪除。在泛娛樂時代,我們強調多元化、多角度、多元素地思考,但是在決策的時候,我們真正要權衡的關鍵點不會超過三個,即當我們確定了定位、方法、結果預測后,我們只需要刪除一些大數據,讓一切變得清晰起來。

我們的一切預測都是基于大數據,所以想要得到精準的預測,必須按照上面四個方向去探索。不過,美國電影公司夢工廠CEO卡森伯格堅持認為,電影創作靠的是創造力,而不是數據分析。

因此,我們需要思考,在大數據時代,我們可以獲得哪些數據,我們希望和能夠從這些數據中挖掘出哪些信息。如果只是單純地依靠數據分析,得出的規律未必具有實際價值。因此,只有將數據分析與行業經驗結合起來,總結出行業規律,形成一個精準的行業模型,才能具有實際指導意義,從而產生巨大的價值。

5.利用大數據推出的《紙牌屋》

自從進入21世紀以來,美國電視劇業便迎來了第二個黃金時代,由于其畫面精良、陣容強大、攝影專業,無論是作品水平,還是全球化程度,都呈現出前所未有的高水準,不過與此同時,要在這么多的大制作中脫穎而出也加大了難度。

可是《紙牌屋》不用擔心這個問題,其從北美市場出發,一路所向披靡,最后在全球掀起一陣收視狂潮的一個重要原因,正是大數據分析技術的應用。位于加州加斯蓋圖的一家在線影片租賃提供商Netflix公司,僅在美國市場,就有2700萬的訂閱用戶,每天用戶在Netflix上會產生3000多萬個行為,包括暫停、回放、快進等,還會給出400萬個評分和300萬次搜索請求。

Netflix正是利用這些數據制作出的《紙牌屋》。通過官方網站,Netflix收集了大量用戶的行為偏好數據,并對其進行分析發現,在那些喜歡觀看英劇版《紙牌屋》的用戶之中,點擊率最高的是鬼才導演大衛·芬奇和男演員凱文·史派西,而最受歡迎的電影類型是“政治驚悚”。

于是,Netflix決定斥資1億美元,請來大衛·芬奇做導演,打造了新版的《紙牌屋》,由凱文·史派西擔當主演。其實僅從劇本質量來看,《紙牌屋》并不超出同期的其他幾部熱門劇。不過在《紙牌屋》中,主要聚焦政治黑暗面,而不是進行美國政界科普。

結果,Netflix賺得盆滿缽滿,就連美國總統奧巴馬也是其忠實觀眾,雖然他說自己在白宮中并沒有電視主人公那般的超能力?!都埮莆荨返谋t,體現了新興的大數據模型與傳統影視工業的結合,影響著整個娛樂市場的未來。

Netflix是如何將數據轉化為生產力的?

在以美國為代表的西方成熟影視工業市場,其運作方式與以中國為代表的傳統影視制作模式截然不同。在好萊塢,無論是由明星主演的名導名編劇的大制作,還是一些具有特定類型設定的肥皂劇,其最重要的目的就是贏利。

而只有符合觀眾口味才能賺錢,因此,觀眾的需求是衡量影視劇是否成功的最重要的標準,只要建立在這個基礎上,無論是大制作還是小成本,最后都可能達成目標。尤其是在全球經濟普遍低迷的這幾年,口紅效應(低價產品偏愛趨勢,因經濟蕭條,導致口紅等廉價非必要物的熱賣)逐漸顯現,娛樂工業也隨之迎來繁榮。《紙牌屋》正是在這樣的背景下出現。

而《紙牌屋》的成功,不僅僅在于趕上了娛樂行業發展的快車,更在于其出品商Netflix對大數據的匠心獨運。Netflix是美國一家領先的視頻播放網站,成立于1997年,主營業務是向家庭提供互聯網即時媒體播放。登錄Netflix賬號后,用戶可以通過個人筆記本電腦、電視、iPad及iPhone等媒體,實時觀看各類節目。

根據美國HIS信息咨詢公司的統計結果,早在2011年,Netflix的網上視頻收入總和就已經超過了蘋果,網站整體份額占據北美在線電影總銷量的45%,而最接近的競爭對手亞馬遜所占份額僅僅為1.8%。

雖然占據了流媒體視頻播放服務提供商的領先地位,不過其CEO威爾默特·哈斯廷斯認識到,如果想繼續保持這種領先地位,必須將自身與其他競爭對手區分開。而Netflix的大數據基因,正是推動《紙牌屋》出現的直接原因。

作為大數據在娛樂市場的開山之作,《紙牌屋》之所以沒有出現在其他娛樂公司,源于成立之日起,Netflix的核心競爭力和發展戰略的核心就是數據的計算和分析。借助推薦引擎和數據算法,Netflix可以提前得知觀眾喜歡看的影視內容,并根據結果進行準確地采購,再加上流媒體的廣泛應用,觀眾再也不是一個靜靜守候在電視機前的群體,這也讓Netflix頗為受益。

Netflix的通信負責人喬納森·弗萊德蘭德說:“我們知道人們正在Netflix上觀看什么內容,而且根據人們的觀看習慣,我們有能力去了解特定的一部劇集的受眾人群可能會有多大,對此我們具有高度的信心。我們想要繼續為所有人提供內容。隨著時間的推移,我們正越來越善于選擇內容,能帶來更高的觀眾參與度。”

這是一個真實的Netflix,不僅僅將希望寄托在利用獨家內容與那些已經占據行業地位的有線電視網絡展開正面抗爭,還希望引入傳統電視網絡所缺少的大數據,認知人們的觀看習慣和偏好。美國知名電視評論人胡特·斯特恩說:“如果Netflix知道哪些觀眾喜歡看哪些頻道,那就好像是打開了上帝的禮物,傳統電視運營商將毫無抵抗力?!?/p>

其實,數據的分析和運用在電影工業并不新鮮,從電影市場最成熟的好萊塢來看,從一部電影的創意、拍攝,一直到后期的發行,數據整理無處不在,最終,投資方會根據不同組合的收視效果,排列出最優的創作和放映方案。

不過,這種數據分析形勢并不等于大數據,無論是從數據的體量、類型、商業價值還是處理速度來看,大數據都與傳統的數據挖掘技術有著本質的區別。在業內,大數據被歸納為4個“V”——Volume(體量)、Variety(類型)、Value(價值)、Velocity(速率)。

對于影視業,大數據不僅提供了一種創作的工具,更提供了一種觀察世界的維度,大數據能夠提供更多、更深入的關于制作、投資、營銷的分析信息,幫助更好地進行決策?!都埮莆荨返某晒?,主要在于Netflix利用大數據分析巨量用戶的需求,而縱觀整個影視制作行業,一些影視公司使用的數據分析,不過是對數據的簡單挖掘。

而從數據獲取、質量及相關性分析、巨量數據處理技術和確定商業應用等方面的成本來看,大數據的高門檻導致了其目前還只能是“有錢人的游戲”。在中國,也只有一些大型的以用戶為導向的公司,如阿里巴巴、騰訊等一些天然坐擁巨量高質數據累積的公司,才能說可以利用大數據。

而在與消費者距離較遠的影視工業,目前還沒有哪一家公司具備熟練運用大數據的實力。因此,更多的則是一方面基于大型公司提供的大數據研究獲取數據,或者通過抓取的方式得到數據,另一方面進行商業運作來吸引用戶,在這個過程中建立自己的數據,同時對這些數據進行再加工??梢?,在影視行業,要實現大數據的廣泛運用還有一段很長的路要走。

主站蜘蛛池模板: 阳东县| 天门市| 惠州市| 长乐市| 临高县| 博白县| 德钦县| 涿州市| 乌苏市| 白朗县| 德保县| 开封县| 济阳县| 九台市| 循化| 宜城市| 沂水县| 麟游县| 咸宁市| 轮台县| 色达县| 井冈山市| 哈巴河县| 长沙市| 谢通门县| 松溪县| 聂荣县| 青浦区| 城口县| 昌平区| 泸溪县| 道真| 罗平县| 长丰县| 施秉县| 沽源县| 宜城市| 大冶市| 中卫市| 沭阳县| 平度市|