官术网_书友最值得收藏!

第五節(jié) 應(yīng)用案例

阿里巴巴數(shù)據(jù)委員會(huì)自建立以來(lái),數(shù)據(jù)質(zhì)量就成了該部門(mén)的核心工作,車(chē)品覺(jué)[2]認(rèn)為數(shù)據(jù)質(zhì)量是大數(shù)據(jù)的命門(mén),如果將大數(shù)據(jù)比作水流,來(lái)自任何支流的數(shù)據(jù),如果質(zhì)量有問(wèn)題,都會(huì)帶來(lái)整個(gè)水源的污染。由于淘寶等平臺(tái)上的數(shù)據(jù)良莠不齊,存在不少虛假數(shù)據(jù),會(huì)帶來(lái)很大的干擾。有時(shí),在淘寶平臺(tái)上,對(duì)于一個(gè)人,我們會(huì)看到2部手機(jī)、1個(gè)iPad、3張信用卡、5個(gè)淘寶賬號(hào),收集數(shù)據(jù)時(shí),以為是多個(gè)人,但實(shí)際上就是一個(gè)人。但如果依照這個(gè)數(shù)據(jù),商家可能就將紅包給了一個(gè)不活躍的賬戶。為此,阿里巴巴數(shù)據(jù)委員會(huì)試圖剔除虛假的數(shù)據(jù),讓收集的數(shù)據(jù)能反映真實(shí)的消費(fèi)情景。比如上面的案例,就要鑒定所有這些賬戶、信用卡等是否為同一個(gè)人所有。再如,阿里巴巴數(shù)據(jù)委員會(huì)經(jīng)常要做產(chǎn)品界面測(cè)試,有時(shí)它會(huì)臨時(shí)修改界面,會(huì)突然多出一個(gè)按鈕,這就會(huì)帶來(lái)大量誤點(diǎn)擊操作,數(shù)據(jù)收集時(shí),就會(huì)得到很多失真的用戶行為數(shù)據(jù)。阿里巴巴數(shù)據(jù)委員會(huì)的數(shù)據(jù)管理人員目前的工作就是要將這些失真的數(shù)據(jù)剔除,或者將數(shù)據(jù)還原到真實(shí)的場(chǎng)景。為了更好地管理和利用大數(shù)據(jù)資源,阿里巴巴數(shù)據(jù)委員會(huì)采取的具體措施如下。

打破分割統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)。統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn),就是讓凈化后的數(shù)據(jù)流得以匯集。阿里巴巴下屬各個(gè)部門(mén)業(yè)務(wù)重點(diǎn)不同,對(duì)數(shù)據(jù)的理解不同,因此數(shù)據(jù)標(biāo)準(zhǔn)往往各不相同。要將這些數(shù)據(jù)匯集成大數(shù)據(jù)之海,就必須統(tǒng)一標(biāo)準(zhǔn),這也是阿里巴巴數(shù)據(jù)委員會(huì)目前重點(diǎn)推行的項(xiàng)目。

精細(xì)化管理數(shù)據(jù)。“目前,我們需要的用戶數(shù)據(jù),平臺(tái)還給不了。”阿里巴巴平臺(tái)上的一個(gè)企業(yè)如是說(shuō)。很多企業(yè)希望阿里巴巴能將用戶屬性的標(biāo)簽分得更細(xì)(不僅分男、女用戶,還進(jìn)一步按不同消費(fèi)特點(diǎn)、收入細(xì)分)。小也化妝品創(chuàng)始人肖尚略認(rèn)為,“平臺(tái)數(shù)據(jù)的細(xì)分是基礎(chǔ),細(xì)分好,企業(yè)才能用好”。如何讓數(shù)據(jù)精細(xì)化?阿里巴巴數(shù)據(jù)委員會(huì)根據(jù)各個(gè)商家的應(yīng)用場(chǎng)景,將原始數(shù)據(jù)打上更細(xì)致、對(duì)商家更有參考價(jià)值的標(biāo)簽。以淘寶平臺(tái)為例,一方面收集用戶信息時(shí),專(zhuān)注對(duì)商家更實(shí)用的內(nèi)容,比如對(duì)于在外租房的大學(xué)生用戶,除了收集他們的地址信息外,還會(huì)通過(guò)其他渠道收集其房租的租金,從而了解對(duì)方的消費(fèi)水平,將這些數(shù)據(jù)提供給相應(yīng)的商家。另一方面根據(jù)商家的應(yīng)用情景,對(duì)數(shù)據(jù)材料做初加工。比如我們從中篩選出一個(gè)人是否戴眼鏡,戴的眼鏡是多少度的數(shù)據(jù),就對(duì)賣(mài)眼鏡的商家起到了很大作用。

在數(shù)據(jù)精細(xì)化思路下,2011年底,阿里巴巴的支付寶平臺(tái)開(kāi)發(fā)黃金策產(chǎn)品,車(chē)品覺(jué)帶領(lǐng)團(tuán)隊(duì)處理了1億多活躍的消費(fèi)者數(shù)據(jù)后,篩選出500個(gè)變量,用它們來(lái)描述消費(fèi)者,最終讓企業(yè)能夠隨時(shí)調(diào)用變量,獲得用戶信息,比如某一類(lèi)包含使用信用卡數(shù)量和手機(jī)型號(hào)等具體信息的客戶數(shù)目。2013年,天貓開(kāi)始研發(fā)適用于天貓商家的系統(tǒng),通過(guò)對(duì)會(huì)員標(biāo)簽化,讓商戶了解店鋪會(huì)員在天貓平臺(tái)的所有購(gòu)物行為特點(diǎn)。

收集更多的外部數(shù)據(jù)。在阿里巴巴平臺(tái)上,大多時(shí)候收集的是顧客的顯性需求數(shù)據(jù),如購(gòu)買(mǎi)的商品和瀏覽等數(shù)據(jù),但顧客在購(gòu)買(mǎi)之前,就可能通過(guò)微博、論壇、導(dǎo)購(gòu)網(wǎng)站等流露出隱性需求,所以?xún)H僅做好自己的大數(shù)據(jù)是不夠的,還要納入更多外部數(shù)據(jù)。

阿里巴巴曾嘗試通過(guò)收購(gòu)掌握中國(guó)互聯(lián)網(wǎng)的底層數(shù)據(jù)。2013年4月,阿里巴巴收購(gòu)新浪微博18%的股權(quán),獲得了新浪微博幾億用戶的數(shù)據(jù)足跡。5月,阿里巴巴收購(gòu)高德軟件28%股份,分享高德的地理位置、交通信息數(shù)據(jù)以及用戶數(shù)據(jù)。其他的并購(gòu)包括墨跡天氣、友盟、美團(tuán)、蝦米、快的、UC瀏覽器等,阿里巴巴也從中獲得了大量的數(shù)據(jù)。通過(guò)這些并購(gòu),阿里在試圖拼出一份囊括互聯(lián)網(wǎng)與移動(dòng)互聯(lián)網(wǎng),涵蓋用戶生活方方面面的全景數(shù)據(jù)圖。

加強(qiáng)數(shù)據(jù)安全管理。淘寶賣(mài)家希望阿里巴巴能加大數(shù)據(jù)開(kāi)放的步伐,對(duì)于阿里平臺(tái)來(lái)說(shuō),這并不是一件容易的事情,因?yàn)檫@關(guān)乎商家和消費(fèi)者的隱私,商家不希望競(jìng)爭(zhēng)對(duì)手獲得自己的機(jī)密信息,消費(fèi)者也不希望被更多干擾。因此,阿里巴巴內(nèi)部專(zhuān)門(mén)成立了一個(gè)小組,來(lái)判斷數(shù)據(jù)的公開(kāi)與否,把握“誰(shuí)應(yīng)該看什么,誰(shuí)不應(yīng)該看什么,誰(shuí)看什么的時(shí)候只能看什么”。

主站蜘蛛池模板: 漳平市| 永登县| 吉隆县| 交口县| 稻城县| 泗洪县| 本溪市| 栾城县| 新平| 楚雄市| 曲麻莱县| 鹤庆县| 长岛县| 三都| 蕲春县| 新邵县| 甘肃省| 依兰县| 都匀市| 沾化县| 油尖旺区| 西畴县| 通化市| 清镇市| 拜城县| 嵩明县| 安新县| 景德镇市| 嘉黎县| 夹江县| 伽师县| 固原市| 东阳市| 孟津县| 莒南县| 舟山市| 青州市| 湖北省| 海丰县| 南岸区| 汝城县|