第四節 大數據帶來的變革
一、大數據產業的關鍵節點
(一)數據的挖掘和存儲:對應云技術的運用和升級
云計算是大數據存儲和分析的重要基礎設施,正是云計算的發展迅速推動了大數據產業的發展,原因有如下三點:一是云計算按需付費和資源共享的特性降低了企業產生和使用大數據的門檻;二是低門檻的特性又推動了大量中小企業使用云計算,從而提高企業信息化程度,加速了數據的產生;三是云計算低使用成本高計算能力提升了企業的大數據處理能力。
云計算促進大數據產業發展的方式,如圖1-6所示。

圖1-6 云計算大大促進大數據產業的發展
(二)數據的整理和分析:對應算法與AI的運用和升級
大數據算法及人工智能的迭代升級提升了數據分析能力。深度學習(deep learning)算法突破性地以更接近人腦的方式利用大量數據訓練機器,通過訓練使其自主掌握規律,而且結果將會隨著數據量的不斷增長而更加準確可靠。
(三)大數據技術的運用場景:對應政府、企業的開放,體量越大的傳統行業,蘊含越大的大數據空間
根據《中國大數據發展調查報告(2015年)》統計顯示,過去制約企業大數據發展的最主要因素首先是政策限制(例如,隱私保護);其次是數據資源的短缺和技術水平的不足;再次是投資大而沒有看到明顯效益;最后是諸如人才短缺等其他原因。政策方面,由于政策、法規的滯后性,數據跨部門、跨企業、跨行業甚至跨領域流動的需求被牢牢禁錮,這也使得政策限制成了擺在我國企業大數據應用面前的最大障礙。數據資源增長迅速,但是如何通過技術手段獲取高質量的數據是企業面臨的重要問題。
但隨著政府對大數據戰略的日益重視,政府和企業的數據開放流動正在開始。
政府擁有最豐富和最優質的大數據資源,各個政府部門掌握著社會第一手的原始數據,如房地產、醫療、教育、金融、交通、旅游、氣象、電力、海關、司法、人口等各類經濟和社會運營的基礎數據。過去政府數據更新頻率低且未向社會開放,因此社會并未充分挖掘這一塊數據的價值,目前政府已經意識到數據的重要性并出臺政策逐步開放大數據供社會利用。若政府大數據獲得有效利用,將產生巨大的價值。
相應地,企業的經營中也將產生大量數據,包括用戶信息、用戶行為、產品運行數據等。根據《中國大數據發展調查報告(2015年)》顯示,企業對大數據資源最大的需求來自企業信息公開,繼而是政府所擁有的大數據信息。過去互聯網數據已經進行了大量的應用,未來隨著企業銷售、供應、經營的互聯網化,企業與客戶、供應商、中間商的互動互聯網化將產生大量的數據。
二、大數據帶來的六大趨勢
信息技術的發展帶來了產業形式、經濟形態、商業模式、組織模式、文化習慣等多方面的變革,從表1-1中可以更清晰地看出產業變革的重點方面。
表1-1 信息革命帶來的產業變化

大數據的發展為我們帶來了第二次信息革命,經過幾年的發展,大數據即將帶來的產業變革趨勢已初見端倪。從當前的經濟發展水平與大數據技術的融合中,可以預見的未來,幾項已經存在的發展趨勢正在擴大。
(1)應用無線化。大數據技術的廣泛應用為數據采集與分析提供了更大的便利性與移動性,讓終端設備與資料采集的作業更彈性而有效率,也為智能生活帶來了可能。
(2)信息數據化。數據信息無處不在,而大數據處理數據的高速巨量、多樣化、在線化使得信息的流通、交換、加工、運用更趨標準化與結構化,數據的應用變得更即時直接。
(3)交易無紙化。大數據、云計算支持下的在線交易平臺憑借其實時性、便利性正在迅速地替代傳統的線下交易與紙質憑證,徹底地改變了交易行為與資金流,并賦予未來微經濟商業模式更多創新思考的可能性。
(4)思維智能化。大數據所產生的創新價值與人類交互并深入于生活之中,極大地改變了人們傳統的思維方式,人的思維與新科技將會迎來前所未有的碰撞與火花。
(5)決策實時化。數據處理、分析技術的提高,改變了過去因數據獲取成本過高而面臨的信息不對稱的困境,能夠實現過去難以達到的實時性和精確性,大數據實時采集與加工極大地改變了決策與信息關系。
(6)線下線上化。海量數據使得線上與線下更加融為一體,未來仍將呈現線下更多地運用線上數據傾倒的趨勢,線上與線下將連接在一起不能分割。
這些本質上的轉變將會貫穿未來大數據發展的進程中,六個趨勢會在各自的體系內深化發展與創新。商業價值會逐漸落地于各行業中,數據技術成為各行各業的優化工具或產生顛覆性創新。大數據本身的發展也將被自我顛覆,數據的釆集、更新、識別、關聯將會變得越來越自動化。
三、數據變革帶來的五大領域顛覆
大數據帶來的趨勢轉變將逐漸改變我們生活的方方面面,其中有幾個領域將率先面臨顛覆。
(一)數據安全
隨著大數據的廣泛應用,數據安全日益引起關注。2015年數據安全事件頻發,隨著全球各國逐漸采用更先進的數據安全技術并制定更完善的數據保護法律,數據安全監管趨嚴將是未來的一大趨勢。
在數據安全方面,相比商業機密的保護問題,人們更注重的是如何守護個人隱私。數據安全意識提升的背后是人們對數據公開化及其風險的擔憂。如果數據風險無法被有效管控,人們就無法在真正意義上信任數據,而這將在很大程度上阻礙日益發展的大數據產業。個人的隱私、公司機密乃至國家與國家之間的數據保護,將會是未來亟待完善的部分。當數據成為商業重要且關鍵的資產時,像“首席數據隱私官”這樣的職業也就應運而生了,數據安全與數據隱私保護成為數據應用中不可或缺的一部分。
(二)分析的簡化與外包
數據分析工作的簡化與外包,預示著未來大數據將會向產業鏈分工的趨勢發展。隨著數據信息的迅速膨脹和大數據應用的逐步落地,越來越少的企業可以獨立完成從原始資料采集、加工、分析乃至落地應用的完整程序。未來數據的每一個處理階段,都有機會發展出專門的技術公司協助企業完成大數據應用前的整備工作。大數據產業鏈上的每一個環節都有可能產生新的問題與創新,大數據產業革新的每一階段都有可能激蕩出新的問題與機會。新的問題不斷地聚焦起來,對應的數據源也趨于集中,這時一個新的產業鏈機會也就隨之產生。中間層(iddle layer)的服務與創新,對于大數據產業的發展將扮演著至關重要的角色。
(三)政府的數據態度
從大數據產業鏈的整體來看,政府擁有最多的數據。因為政府鎖定了大部分公共服務領域的關鍵數據源,它是公共數據開放的大資源,也是一把驅動大數據的金鑰匙。政府的數據涵蓋金融、醫療、能源、食品、交通、治安、環境等多個方面,且所有這些數據都是相對集中且十分關鍵的,政府數據的開放將是產業創新的催化劑,對于整體數據產業的發展也至關重要。2016年,我們可以觀察政府對于公共數據開放的態度,而各個行業也可以順應政府數據政策的腳步,開始嘗試進入大數據驅動乃至大數據變革的第三階段。
(四)多屏時代
過去幾年間,手機極大地顛覆了我們的生活,但隨著大數據的發展,可以預見未來有兩個新的屏即將改變我們的生活:一方面是Smart TV,即家里的電視屏,收集你看過節目的相關數據并且會向你推薦你愛看的節目,形成了自然數據閉環;另一方面是物聯網汽車,將來所有汽車的內部都會像Tesla一樣,中央顯示屏控制每個部分、記錄汽車行駛中的所有數據,信息的流動由此產生。可以根據時間分配(time share)和載具分配(device share)這兩個層次來思考這個問題:通常情況下人在不同的時間會因為當時具體的環境狀態,對不同的設備具有不同的依賴程度。在家時對Smart TV的依賴一般會比手機高,而離開家前往下一個目的地時,則更需要的是手機,如果是自己開車,車載導航或車載屏幕將會成為主要的關注對象。因而,未來互動的過程中我們應當更加關注如何采集到有價值的數據,并進一步對使用者的日常生活做出優化的回饋。
(五)數據行業化
互聯網影響比較大的行業必然更容易數據化,因而大部分大數據應用的落地點都與特定行業相關,已經嶄露頭角的就有金融、醫療、電商等行業。下一步大數據的應用應該會在不同的領域各自發展,并不存在適用于每一個領域的通用的解決方案,而包括零售、醫療、教育、金融等行業都將因“互聯網+”的帶動而發展。很多小公司起步,產生了很多小數據,這是從0到1的過程,然后整合碎片化的數據,最后積累大量數據。這三個進程的時間點加上不同的應用,鑄就了行業大數據。未來大數據將從過去的淺層連結(weak link)轉變為深層連結(deep link)。從大數據由淺而深的演變中可以觀察到:從前習慣以行業為出發點,思考網絡(數據)可以幫我們做什么,到了互聯網和大數據的時代,則轉變為以網絡(數據)為出發點切入思考,再把原行業的思維放進來碰撞,看看可以激蕩出什么樣的創新思維。Uber、Airbnb都顛覆了以往行業運用網絡的概念,但只有這種思考與創新的方式才能將跨行業的東西提升出來。
四、大數據變革下的三大關鍵行業機會
從大數據對傳統行業的顛覆來看,主要的機會在于中間層,尤其是在金融與保險、醫療、零售這三個行業。
(一)金融與保險
用一個詞概括金融在大數據時代的機會點,那就是“微(micro)”。過去很多的創新都受到技術和數據能力的局限。未來數據的采集、加工和應用都將實踐個人化的價值,將會激發很多金融商業模式。數據動態的意義,首先體現在金融保險體系里的客戶監測。過去個人信用評估結果都是滯后的,往往無法有效地反映最新的個人信用風險,導致銀行或是保險公司不能提供最符合顧客需求和利益的服務。其次體現在將解決服務合理性的問題,也就是當客戶使用了服務時,才向客戶收取費用。
以汽車保險為例。過去我們對于汽車保險的保費設定,是根據客戶過往的駕駛肇事記錄來調整保費費率的,也就是說汽車保險的價格標準建立在投保車主的駕駛行為基礎上。但肇事記錄通常具有滯后性,在大數據時代可以利用更便捷的數據采集系統收集更動態的數據,用以預測危險駕駛的風險。或許,未來的汽車都會像特斯拉一樣,通過車內安裝的傳感器,記錄駕駛員如何踩油門(如習慣性的緊急剎車就是一種危險駕駛的訊號)、換道時是否打方向燈、是否頻繁地按喇叭等行為。這些資訊都可以推斷出駕駛員是否擁有安全的駕駛習慣。如果再把駕駛員的行車路線數據與政府公布的危險肇事路段的數據做對比,就可以知道這輛車每天上下班的路線屬于怎樣的安全等級。綜合以上兩類數據,即便沒有肇事記錄,保險公司也能根據這些數據來動態調整風險評比,并隨時調整保費的費率。同理,如果車險是為了確保用車人在駕駛期間的風險,那么通過車輛的傳感器,可以清楚了解這輛車有多少時間停在車庫、又有多少時間處于被使用的狀態,保費的計算也可以根據車輛實際承受風險的時間來對客戶收費,這也就實現了前面所提到的動態計價。
(二)醫療
醫療領域當前所面臨的最大問題是數據未能整合,不同醫院之間未能實現數據信息的互通,比如在A醫院卻拿不到之前在B醫院開的病歷。另一個大問題是中國人口老齡化嚴重,導致醫療費用負擔沉重,因病返貧十分常見。只有降低醫療成本,減少資源和藥物的濫用,才能根本性地減少政府負擔,讓資源分配給真正需要的人。美國福特公司的30萬員工,每年享有30億美元的醫療保險預算,但這筆錢過去只有一個人在管。1997年福特在這方面第一次引入數據應用,分析之后發現有人竟然150歲還在領醫療保險,有人一年領兩次懷孕補助等不合理的現象。這些都是無謂的資源浪費,但如果不通過數據,可能永遠也不會發現這樣的謬誤。醫療是一個連續性的行為,一個人從健康、亞健康乃至疾病的階段都不是突發的,背后都有遺傳或是生活飲食習慣的脈絡可循。很多疾病的危險信號常常是因為信息未能互通而被忽略,如果充分利用信息則可減少危險發生,如美國曾經通過傳染病傳播數據,預估要生產多少疫苗以及各區疫苗使用狀況,大大地提升了疾病防治效果。
(三)零售
對于零售業,最重要的就是如何運用數據把供應與零散的需求做匹配。買家希望得到的是:“我要什么?最快幫我找到我要的東西。給我最好的價格,用對我最方便的方式付款,在剛好的時間送達。”商家就會成為贏家。供應方則希望知道:“怎樣才能滿足消費者?怎樣用最小的庫存,最快的方法,最合理的利潤率來服務顧客?供應鏈的處理怎樣可以變得更好?怎樣減少成本浪費?”以數據驅動為基礎的線上零售發展已經十幾年了,但線下將會出現什么情況?當POI逐漸成熟,拿著手機,處處都能發揮大數據的連接能力,時刻都是機會點。人們懶得再特地下載一個應用程序購物,線上再發達,某些時候它也不是最方便的渠道。要想改善零售用戶的體驗只有開展全渠道的服務,對零售業來說,最好就是線上線下都能覆蓋到。只有online的應用程序是不夠的,最好連offline的渠道都能拿到,不然很容易就會被別人彎道超車,因此全渠道的打通和合作策略是零售業在2016年關注的一個重點。
“推薦”將是另一個爆點服務。現代人能在同一時間享受多種服務,瀏覽多種產品訊息。但數十萬款與你有關的商品攤在你的眼皮底下,你怎么選擇?人主觀上都希望自己可以選擇,但面臨太多選擇時,選擇本身反而變成了一種負擔。所以未來的“推薦”應該是游合于“優選”與“逛”之間。大數據讓手機變成個人消費助理,不斷跟著你走,也不斷領著你走,就會在商家和消費之間成為一個媒介。最后,零售業的根本是“生產”問題。數據將成為產品創新和改良的依據,從設計到生產、包裝、銷售、售后的過程中觀察與不斷優化,最終能夠幫助商家生產出符合顧客需求的商品。雖然是老話一句,但還是不得不再重申一次:“大數據時代對零售業來說不是一個單純的轉型問題,而是一個攸關存亡的生死問題。”
五、數據交易的變革
(一)數據交易的本質
數據的本質,是蘊含在數據背后的信息和知識,其與普通商品的流通有著完全不同的特征。要想清晰地了解大數據帶來的數據交易的變革,就需要深入探索數據交易本身的固有特征。
數據交易的第一個特征是數據是一種無形、能反復交易的物品。數據的交易,與傳統商品流通或者互聯網的流量交易與變現的最大區別就是數據的可反復交易性。從理論上說,數據可以同時賣給各個不同的買家,因為數據出售的邊際成本接近零。這一特征與數字內容十分類似,數字內容包括了軟件技術、游戲、電影、唱片等擁有明確版權的無形商品,它們的共有特征同樣都是內容制作需要大量的成本,但后續銷售的邊際成本接近零。
在定價理論中,像數字內容這樣供應量無限的商品,其最優定價是客戶群的平均客戶感知價值(customer perceived value, CPV),即買家內心感知該商品的實際價值,相當于買家意愿中的最高出價。而在實際中,有大量的應用采取免費使用、后向變現的模式,因為免費應用可以通過會員制、流量變現等方式構筑嚴密的商業模式閉環。而數據則帶有準生產資源的性質,只要能合理分發到特定的需求方,數據很容易就能轉變為價值。而對于一個商業模式最為關鍵的一點,就是能創造顯著與持續的收益,而對數據進行大規模免費共享并不是實現總體收益最大化的模式。而數據不適合共享的第二個原因,就是數據的價值相對性。即使是同樣一個數據集,對于不同的企業其價值可能有天淵之別。因此,對于數據這種相對價值差異極大的產品進行定價,免費模式就幾乎不可能達到經濟上的帕累托最優。
數據交易的第二個特征是數據價值的相對性。數據需求方的不同要求,使得某些數據對于特定的人群是有價值的,而對于其他人群其價值十分有限。即使是擁有對于幾乎所有的企業都是非常有價值的數據,例如擁有整個中國13億人的興趣愛好標簽數據,但實際上大部分企業只是需要其中的一部分而已,如母嬰電商只需要關注其中的女性用戶數據。讓數據需求方把全體數據買回去顯然是不符合市場規律的,數據交易需要給予數據需求方“挑數據”的權力。
上述案例充分說明了數據總體價值在需求方中的差異性,以及數據本身內在價值分布的差異。對于大部分數據交易,使用傳統商品交易的方式,即供給方簡單為數據貼上一個價格標簽掛平臺出售的方式是不合適的。而采用競價拍賣,即需求方定價,顯然更符合市場的實際情況。
數據交易的第三個特征是交易不局限于數據本身,還包括知識。這個看起來非常顯而易見的觀點,實際是數據交易中最為核心的原則。在未來成熟的數據交易市場中,主要交易的量會圍繞蘊含在數據背后的知識,而數據的知識發現(knowledge discovery in data, KDD)將會是數據交易市場的核心任務,其中的道理也是顯而易見的,需求方分別把數據買回去然后做個應用無疑是不經濟的,更好的模式是,知識已經由數據交易市場以云計算的形式處理好,由需求方直接購買回去使用。而至于怎樣對這些“無價”的知識進行定價出售,數據交易市場需要設計一套巧妙的機制,通過需求方定價的方式去激活市場。在未來,數據交易產品化將會是重大趨勢,而數據知識發現是其中的核心問題。
數據交易的最后一個特征是數據涉及的隱私性。目前的數據交易之所以困難,在于大部分有交易價值的數據都與用戶的個人隱私有緊密關聯。如國內三大電信運營商雖然具備用戶全行為洞察以及跨屏數據的巨大優勢,但在數據變現中腳步蹣跚,最主要原因在于用戶隱私紅線。因此,在數據交易中必須把數據當事人也考慮在內,充分考慮數據交易的“四方關系”。
(二)未來的數據交易市場
除非數據交易市場的存在能夠顯著降低數據交易的交易成本,否則數據交易雙方是沒有任何理由在交易市場開展交易的。數據交易的成本,由搜尋成本、因信息不對稱導致的風險成本、議價成本(狹義的交易成本)組成。其中搜尋成本是數據買賣雙方對接需求并成功撮合所需要付出的成本;而風險成本是由于數據交易的雙方信息不對稱,所出現的賣方夸大數據價值、以次充好等道德風險行為;而議價成本是雙方在數據定價問題上討價還價帶來的價值損耗。如果缺乏一套有效的數據定價機制,則交易雙方會圍繞數據定價損耗大量的精力與成本,將大大降低市場的效率。
下面我們從數據交易市場的交易對象、參與方與定價這三個不同的角度闡述數據交易市場運行的模式及其定價機制。
1. 數據交易市場的交易對象
數據交易市場的交易對象就是可交易的數據,可以分為兩類:第一類是非閉環數據,即不涉及任何個人隱私的統計性與科研數據,如各類經濟及行業統計數據、用于工程及研究目的的數據,如聲音語料庫、城市交通數據、匿名的上網行為數據等。這類數據由于不涉及個人隱私,一般可以認為產權屬于所有方,采取“柜臺式”報價掛牌交易即可。
而國內數據交易平臺——“數據堂”就是第一類數據交易的典型,這類數據在交易過程中的搜尋成本相對較低,通過傳統的檢索技術就能快速撮合數據買賣雙方,但也存在出售方夸大數據價值、以次充好的風險成本。有一個具有啟發性的思路是,數據交易中心可借鑒手機應用商店做法,設計激勵政策將數據供給方的角色從“出售者”轉變為“數據長期運營者”,即鼓勵供給方不斷維護、升級所提供的數據,比如勘誤、定期更新數據(類似應用商店中的版本管理),激勵手段如給予活躍維護數據的供給方的數據產品提供在平臺上更多的曝光、平臺扣取部分收入做根據購買者售后投訴情況的備用賠付金等。長此以往,數據需求方不再是花錢“購買數據”而是“訂閱數據”,這樣不僅能減少提供方“以次充好撈一票就走”的行為,也更能體現交易對象是數據服務的本質。
實際上第一類數據的交易中還存在另外一個交易風險成本,那就是如何保證數據購買方獲得數據以后,不會私下把數據重復賣給其他需求方,這個風險不解決,勢必在大范圍數據交易中降低數據供給方對于數據收益的預期,從而導致數據供給方不得不提升數據售價,反過來迫使購買方通過私下倒賣的方式降低自身購買成本,形成惡性循環。從這一角度出發,數據交易市場可以通過指定規則與設置技術手段提升購買方的違規成本,如嚴格的準入與會員等級特權制度,促使購買方珍惜自身交易資格避免違規,同時運用技術手段在數據中加入用于識別的隨機信息,從而輕易追查出私下倒賣的會員。
而數據交易中的第二類數據,即涉及個體用戶的行為與興趣的隱私數據,蘊含著巨大的商業價值。這類數據交易前應把PII信息(個人身份可辨識信息)去除,但用于找出這個用戶的虛擬用戶身份標識是不能被去除的,否則哪怕數據再有內涵,無法定位到用戶并轉變為營銷與洞察,這類數據都是難有用武之地的,但保留用戶身份標識又涉及了隱私保護的問題。正是由于對于隱私保護的憂心忡忡,第二類數據的交易難度與成本都非常的高,而如何促成這類交易,則是數據交易市場的核心任務。
無論是個人征信、在線廣告定向、大數據精準營銷都與細分到個人的第二類數據密切相關,同時在線廣告業的實踐證明,這類數據雖然涉及隱私問題,但并不是不可交易的,需要的是一套隱私保護與管理機制。同時,第二類數據交易也將會是未來數據交易的核心內容,而交易過程的隱私保護與管理機制同時將會是數據交易市場的核心競爭力。
此外,對于數據交易的最佳隱私保護方法不是試圖隔離用戶的知曉,而是讓用戶這個數據當事人能參與其中,甚至獲取部分數據交易的收益。例如,對于允許自身數據被制作為興趣標簽的用戶,在精準推薦中能獲得商家更好的折扣。如此的良性互動才能提高數據交易市場的效率。
2. 數據交易的參與方
現在業內每當在新掛牌的數據交易所會員名單中,發現赫赫有名的互聯網巨頭時都會莫名興奮,仿佛數據交易即將會因為這些數據資產寡頭的到來而即將被激活一樣。但數據交易市場作為一個雙邊平臺,其興起的根本要素在于具備足夠數量的活躍供給和需求方,除了巨頭以外,更應當關心長尾數據,即散落在不同所有者上的零散數據,每個所有者擁有的數據量不會特別大,因此不足以激勵他們想辦法變現數據。而數據交易中心則作為一個平臺能夠提供便捷的數據變現能力,需要吸引到長尾數據供給方的到來,并提供平臺能力幫助中小數據供給方變現手中的數據。
大數據交易的價值,還應該體現在交易的多樣性上,如何吸引長尾數據的到來,是數據交易市場的另外一個關鍵任務。
3. 數據交易的定價
數據交易市場的存在就是為了降低數據交易中存在的高昂風險成本。針對特定的數據,我們應當采取不同的定價策略,實現交易成本的最小化。因此,下文把數據交易的定價分為第一類數據和第二類數據。
第一類數據即不涉及用戶隱私的統計或科研數據,其定價相對比較簡單,大部分情況下,采取供給方定價的形式就足夠了。一方面是因為這類數據不涉及個人,其價值相對性的波動不大,無須采用更復雜的定價模式;另一方面是采取供給方定價的方式能將數據產品運營權保留在供給方,使其能夠以各種如限免、促銷等方式運營數據,使得有價值的數據能夠普惠更多的需求方。
而第二類數據即個人特征行為數據,由于能直接用于如個人征信、營銷等商業用途,其價值相對性的波動會非常大,大到甚至連供給方都不能準確評估其市場價值的程度。因此,這類數據比較理想的定價方式是需求方定價,如在線廣告數據平臺Bluekai的定價方式就是采取數據競拍即需求方定價的方式,價高者得,同時控制數據的供給數量,確保一份有價值的數據僅被一到兩家客戶所有。
個人特征及行為數據的鮮明特點是超乎想象的細分程度,數據需求方僅會對其中一小部分數據感興趣,如上海的淘寶賣家一般只關心江浙一帶的用戶數據,使得供給方對千千萬萬的細分數據做定價變成了幾乎不可能的任務。正如當初Google推出搜索引擎關鍵字廣告時,根本不可能對幾百上千萬的各種關鍵字逐一定價出售,最有效的方式就是采取需求方定價,即關鍵字競價形式,綜合出價最高的廣告主將贏得對應廣告位的展示機會。
當然,為實現第二類數據交易的需求方定價,數據交易市場的規則設計是核心問題,另外還離不開的是數據產品化。在交易之前,數據知識發現應該由數據交易市場完成,即數據已經由數據交易市場以云計算的形式經過充分的處理與挖掘,由需求方直接競價購買使用。
(三)對于未來數據交易市場的建議
目前得益于大數據這一迅猛的風口,在不同省市的政府與商界的推動下,各地數據交易中心如雨后春筍般成立。鑒于政策紅利和對后續牌照發放的不確定性,先搭臺后唱戲的策略實屬無可厚非。正如前文所述,數據交易市場的核心定位是降低交易成本,無法具備這一能力的數據交易中心在長期上是注定要被市場淘汰的。
與掛牌相比,數據交易中心的運營是更為艱難的任務,世界上也許沒有第二種商品的交易會像數據那樣具備想象力和創造性了,對于數據交易中心的短期發展,有幾個可供參考的建議。
(1)數據交易中心首先應該從不涉及個人隱私的統計與科研數據開始入手,著力促進這些數據的交易。
(2)數據交易中心需要具備專業的數據應用團隊,幫助對接數據產品化問題。這個專業的團隊在交易中承擔“催化劑”的角色,撮合供需雙方交易的順利開展,以化解交易市場雖然發展了大量會員但交易量極低的尷尬。
(3)設計良好的制度框架,將數據供給方的角色從“出售者”轉變為“數據長期運營者”,以維持交易市場的長期活躍,這是交易市場發展的根本。
(4)試錯第二類數據的交易,也就是涉及個人用戶,存在一定隱私保護問題的用戶特征與行為數據。
對于數據交易中心的長期發展,在于找到一套成熟的方案,能夠公平合理地交易蘊含著巨大商業價值的第二類數據,這是對于數據交易中心的終極考驗,也異常困難,但倘若能做到,則未來的數據生活或許因此而改變。