官术网_书友最值得收藏!

1.1.1 大數(shù)據(jù)的定義

大數(shù)據(jù)(Big Data)是指無(wú)法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。

關(guān)于大數(shù)據(jù)的定義,很多學(xué)者也給出了自己的觀點(diǎn)。在維克托·邁爾-舍恩伯格、肯尼斯·庫(kù)克耶編寫的《大數(shù)據(jù)時(shí)代》中,大數(shù)據(jù)指不采用隨機(jī)分析法(抽樣調(diào)查),而是采用所有數(shù)據(jù)進(jìn)行分析處理。大數(shù)據(jù)具有5V特點(diǎn)(IBM提出):Volume(數(shù)據(jù)量大)、Velocity(高速)、Variety(多樣)、Value(價(jià)值密度低)、Veracity(真實(shí)性)。

麥肯錫全球研究所給出的大數(shù)據(jù)定義是:一種規(guī)模大到在獲取、存儲(chǔ)、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫(kù)軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模、快速的數(shù)據(jù)流轉(zhuǎn)、多樣的數(shù)據(jù)類型和價(jià)值密度低四大特征。

結(jié)合眾多學(xué)者的觀點(diǎn),可以發(fā)現(xiàn)大數(shù)據(jù)具有如下特征。

(1)數(shù)據(jù)量大(Volume)

第一個(gè)特征是數(shù)據(jù)量大。大數(shù)據(jù)的起始計(jì)量單位至少是PB(220GB)、EB(230GB)或ZB(240GB)。

(2)多樣(Variety)

第二個(gè)特征是數(shù)據(jù)類型繁多,包括網(wǎng)絡(luò)日志、音頻、視頻、圖片、地理位置信息等,多類型的數(shù)據(jù)對(duì)數(shù)據(jù)的處理能力提出了更高的要求。

(3)價(jià)值密度低(Value)

第三個(gè)特征是數(shù)據(jù)價(jià)值密度相對(duì)較低,隨著物聯(lián)網(wǎng)的廣泛應(yīng)用,信息感知無(wú)處不在,信息海量,但價(jià)值密度較低,如何通過(guò)強(qiáng)大的機(jī)器算法更迅速地完成數(shù)據(jù)的價(jià)值“提純”,是大數(shù)據(jù)時(shí)代需要解決的難題。

(4)高速(Velocity)

第四個(gè)特征是高速,即產(chǎn)生速度快,這是大數(shù)據(jù)區(qū)分于傳統(tǒng)數(shù)據(jù)挖掘最顯著的特征。

(5)真實(shí)性(Veracity)

第五個(gè)特征是數(shù)據(jù)的真實(shí)性。具體指數(shù)據(jù)的準(zhǔn)確性和可信賴度,即數(shù)據(jù)的質(zhì)量。

大數(shù)據(jù)的價(jià)值體現(xiàn)在以下幾個(gè)方面。

1)對(duì)大量消費(fèi)者提供產(chǎn)品或服務(wù)的企業(yè)可以利用大數(shù)據(jù)進(jìn)行精準(zhǔn)營(yíng)銷。

2)中小微企業(yè)可以利用大數(shù)據(jù)做服務(wù)轉(zhuǎn)型。

3)傳統(tǒng)企業(yè)充分利用大數(shù)據(jù)的價(jià)值實(shí)現(xiàn)轉(zhuǎn)型。

主站蜘蛛池模板: 炉霍县| 福泉市| 南川市| 建阳市| 威海市| 旌德县| 大同县| 江安县| 永州市| 同江市| 曲麻莱县| 南部县| 洞头县| 永年县| 阳春市| 临泽县| 九江市| 叶城县| 尤溪县| 城步| 桐庐县| 米林县| 绍兴市| 普定县| 太原市| 确山县| 泾源县| 柳河县| 沐川县| 西和县| 兰考县| 宝兴县| 射洪县| 余庆县| 从化市| 花垣县| 广饶县| 河源市| 常山县| 鄂尔多斯市| 平果县|