- 大數(shù)據(jù)管理與應(yīng)用
- 王剛主編
- 1580字
- 2024-05-14 10:09:54
第五節(jié) 應(yīng)用案例
阿里巴巴數(shù)據(jù)委員會(huì)自建立以來(lái),數(shù)據(jù)質(zhì)量就成了該部門(mén)的核心工作,車(chē)品覺(jué)[2]認(rèn)為數(shù)據(jù)質(zhì)量是大數(shù)據(jù)的命門(mén),如果將大數(shù)據(jù)比作水流,來(lái)自任何支流的數(shù)據(jù),如果質(zhì)量有問(wèn)題,都會(huì)帶來(lái)整個(gè)水源的污染。由于淘寶等平臺(tái)上的數(shù)據(jù)良莠不齊,存在不少虛假數(shù)據(jù),會(huì)帶來(lái)很大的干擾。有時(shí),在淘寶平臺(tái)上,對(duì)于一個(gè)人,我們會(huì)看到2部手機(jī)、1個(gè)iPad、3張信用卡、5個(gè)淘寶賬號(hào),收集數(shù)據(jù)時(shí),以為是多個(gè)人,但實(shí)際上就是一個(gè)人。但如果依照這個(gè)數(shù)據(jù),商家可能就將紅包給了一個(gè)不活躍的賬戶。為此,阿里巴巴數(shù)據(jù)委員會(huì)試圖剔除虛假的數(shù)據(jù),讓收集的數(shù)據(jù)能反映真實(shí)的消費(fèi)情景。比如上面的案例,就要鑒定所有這些賬戶、信用卡等是否為同一個(gè)人所有。再如,阿里巴巴數(shù)據(jù)委員會(huì)經(jīng)常要做產(chǎn)品界面測(cè)試,有時(shí)它會(huì)臨時(shí)修改界面,會(huì)突然多出一個(gè)按鈕,這就會(huì)帶來(lái)大量誤點(diǎn)擊操作,數(shù)據(jù)收集時(shí),就會(huì)得到很多失真的用戶行為數(shù)據(jù)。阿里巴巴數(shù)據(jù)委員會(huì)的數(shù)據(jù)管理人員目前的工作就是要將這些失真的數(shù)據(jù)剔除,或者將數(shù)據(jù)還原到真實(shí)的場(chǎng)景。為了更好地管理和利用大數(shù)據(jù)資源,阿里巴巴數(shù)據(jù)委員會(huì)采取的具體措施如下。
打破分割,統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)。統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn),就是讓凈化后的數(shù)據(jù)流得以匯集。阿里巴巴下屬各個(gè)部門(mén)業(yè)務(wù)重點(diǎn)不同,對(duì)數(shù)據(jù)的理解不同,因此數(shù)據(jù)標(biāo)準(zhǔn)往往各不相同。要將這些數(shù)據(jù)匯集成大數(shù)據(jù)之海,就必須統(tǒng)一標(biāo)準(zhǔn),這也是阿里巴巴數(shù)據(jù)委員會(huì)目前重點(diǎn)推行的項(xiàng)目。
精細(xì)化管理數(shù)據(jù)。“目前,我們需要的用戶數(shù)據(jù),平臺(tái)還給不了。”阿里巴巴平臺(tái)上的一個(gè)企業(yè)如是說(shuō)。很多企業(yè)希望阿里巴巴能將用戶屬性的標(biāo)簽分得更細(xì)(不僅分男、女用戶,還進(jìn)一步按不同消費(fèi)特點(diǎn)、收入細(xì)分)。小也化妝品創(chuàng)始人肖尚略認(rèn)為,“平臺(tái)數(shù)據(jù)的細(xì)分是基礎(chǔ),細(xì)分好,企業(yè)才能用好”。如何讓數(shù)據(jù)精細(xì)化?阿里巴巴數(shù)據(jù)委員會(huì)根據(jù)各個(gè)商家的應(yīng)用場(chǎng)景,將原始數(shù)據(jù)打上更細(xì)致、對(duì)商家更有參考價(jià)值的標(biāo)簽。以淘寶平臺(tái)為例,一方面收集用戶信息時(shí),專(zhuān)注對(duì)商家更實(shí)用的內(nèi)容,比如對(duì)于在外租房的大學(xué)生用戶,除了收集他們的地址信息外,還會(huì)通過(guò)其他渠道收集其房租的租金,從而了解對(duì)方的消費(fèi)水平,將這些數(shù)據(jù)提供給相應(yīng)的商家。另一方面根據(jù)商家的應(yīng)用情景,對(duì)數(shù)據(jù)材料做初加工。比如我們從中篩選出一個(gè)人是否戴眼鏡,戴的眼鏡是多少度的數(shù)據(jù),就對(duì)賣(mài)眼鏡的商家起到了很大作用。
在數(shù)據(jù)精細(xì)化思路下,2011年底,阿里巴巴的支付寶平臺(tái)開(kāi)發(fā)黃金策產(chǎn)品,車(chē)品覺(jué)帶領(lǐng)團(tuán)隊(duì)處理了1億多活躍的消費(fèi)者數(shù)據(jù)后,篩選出500個(gè)變量,用它們來(lái)描述消費(fèi)者,最終讓企業(yè)能夠隨時(shí)調(diào)用變量,獲得用戶信息,比如某一類(lèi)包含使用信用卡數(shù)量和手機(jī)型號(hào)等具體信息的客戶數(shù)目。2013年,天貓開(kāi)始研發(fā)適用于天貓商家的系統(tǒng),通過(guò)對(duì)會(huì)員標(biāo)簽化,讓商戶了解店鋪會(huì)員在天貓平臺(tái)的所有購(gòu)物行為特點(diǎn)。
收集更多的外部數(shù)據(jù)。在阿里巴巴平臺(tái)上,大多時(shí)候收集的是顧客的顯性需求數(shù)據(jù),如購(gòu)買(mǎi)的商品和瀏覽等數(shù)據(jù),但顧客在購(gòu)買(mǎi)之前,就可能通過(guò)微博、論壇、導(dǎo)購(gòu)網(wǎng)站等流露出隱性需求,所以?xún)H僅做好自己的大數(shù)據(jù)是不夠的,還要納入更多外部數(shù)據(jù)。
阿里巴巴曾嘗試通過(guò)收購(gòu)掌握中國(guó)互聯(lián)網(wǎng)的底層數(shù)據(jù)。2013年4月,阿里巴巴收購(gòu)新浪微博18%的股權(quán),獲得了新浪微博幾億用戶的數(shù)據(jù)足跡。5月,阿里巴巴收購(gòu)高德軟件28%股份,分享高德的地理位置、交通信息數(shù)據(jù)以及用戶數(shù)據(jù)。其他的并購(gòu)包括墨跡天氣、友盟、美團(tuán)、蝦米、快的、UC瀏覽器等,阿里巴巴也從中獲得了大量的數(shù)據(jù)。通過(guò)這些并購(gòu),阿里在試圖拼出一份囊括互聯(lián)網(wǎng)與移動(dòng)互聯(lián)網(wǎng),涵蓋用戶生活方方面面的全景數(shù)據(jù)圖。
加強(qiáng)數(shù)據(jù)安全管理。淘寶賣(mài)家希望阿里巴巴能加大數(shù)據(jù)開(kāi)放的步伐,對(duì)于阿里平臺(tái)來(lái)說(shuō),這并不是一件容易的事情,因?yàn)檫@關(guān)乎商家和消費(fèi)者的隱私,商家不希望競(jìng)爭(zhēng)對(duì)手獲得自己的機(jī)密信息,消費(fèi)者也不希望被更多干擾。因此,阿里巴巴內(nèi)部專(zhuān)門(mén)成立了一個(gè)小組,來(lái)判斷數(shù)據(jù)的公開(kāi)與否,把握“誰(shuí)應(yīng)該看什么,誰(shuí)不應(yīng)該看什么,誰(shuí)看什么的時(shí)候只能看什么”。
- 郭羽誕《國(guó)際貿(mào)易學(xué)》筆記和課后習(xí)題詳解
- 旅游法規(guī)教程
- 多媒體課件與微課制作(微課版)
- 古代漢語(yǔ)
- 物流系統(tǒng)規(guī)劃與設(shè)計(jì)
- 陶潔《美國(guó)文學(xué)選讀》(第2版)課后習(xí)題詳解
- 2016年CFA中文精讀(Level Ⅰ)2 經(jīng)濟(jì)學(xué)【含2013~2015年真題及詳解】
- 劉炳善《英國(guó)文學(xué)簡(jiǎn)史》(第3版)筆記和考研真題詳解
- 2019年高級(jí)統(tǒng)計(jì)師《高級(jí)統(tǒng)計(jì)實(shí)務(wù)與案例分析》復(fù)習(xí)全書(shū)【核心講義+歷年真題詳解】
- 書(shū)籍設(shè)計(jì)實(shí)踐與案例
- Python 3 爬蟲(chóng)、數(shù)據(jù)清洗與可視化實(shí)戰(zhàn)(第2版)
- 徐一平《日本語(yǔ)言》課后習(xí)題詳解
- 管理學(xué):思想·案例·實(shí)踐
- 西方音樂(lè)史與名作賞析
- 亞歷山大《新概念英語(yǔ)(1):英語(yǔ)初階(新版)》學(xué)習(xí)指南【詞匯短語(yǔ)+課文精解+語(yǔ)法知識(shí)+練習(xí)答案】