官术网_书友最值得收藏!

2.1 適合分析的數(shù)據(jù)格式

由于數(shù)據(jù)的來(lái)源多種多樣,因此,不同來(lái)源的數(shù)據(jù)會(huì)以不同的格式存儲(chǔ)在表中。然而,并非所有格式的數(shù)據(jù)都適合在Tableau中進(jìn)行分析。適合分析的數(shù)據(jù)至少需要符合以下格式要求:

·以一維表結(jié)構(gòu)存儲(chǔ)數(shù)據(jù)。

·盡可能細(xì)化數(shù)據(jù),而非聚合數(shù)據(jù)。

·表中的每一列都有列標(biāo)題。

·表中沒(méi)有空行和空單元格。

1.以一維表結(jié)構(gòu)存儲(chǔ)數(shù)據(jù)

表中的數(shù)據(jù)不能存儲(chǔ)為像數(shù)據(jù)透視表那樣的二維表,而應(yīng)該像數(shù)據(jù)庫(kù)中的表結(jié)構(gòu)一樣,即所謂的一維表,它是指每一列只存儲(chǔ)同一類數(shù)據(jù),表中不能存在包含同類內(nèi)容的多個(gè)列。

如圖2-1所示是一個(gè)二維表的示例,表中的最后3列雖然名稱不同,但是它們都同屬于商品,它們都是商品中的其中一種。為了使表中的數(shù)據(jù)適合分析,需要將最后3列轉(zhuǎn)換為兩列,其中一列存儲(chǔ)商品的名稱,另一列存儲(chǔ)商品的銷量,合并后的表如圖2-2所示。

圖2-1 以二維表結(jié)構(gòu)存儲(chǔ)的數(shù)據(jù)

圖2-2 將二維表轉(zhuǎn)換為一維表

2.盡可能細(xì)化數(shù)據(jù),而非聚合數(shù)據(jù)

表中的數(shù)據(jù)應(yīng)該盡可能細(xì)化,而不是聚合后的數(shù)據(jù)。如圖2-3所示的最后一行對(duì)每種商品的銷量進(jìn)行求和,求和運(yùn)算是聚合的一種,聚合還包括求平均值、計(jì)數(shù)、求最大值、求最小值等。在Tableau中分析數(shù)據(jù)之前,應(yīng)該刪除表中的聚合數(shù)據(jù)。

另一種情況是表中的數(shù)據(jù)應(yīng)盡可能詳細(xì)。例如,表中包含按天記錄的數(shù)據(jù)要好于按月記錄的數(shù)據(jù),數(shù)據(jù)級(jí)別越詳細(xì),在Tableau中就可以進(jìn)行更多的分析。

3.表中的每一列都有列標(biāo)題

應(yīng)確保表中的每一列都有列標(biāo)題,以便在將這些數(shù)據(jù)導(dǎo)入Tableau Desktop時(shí)能夠顯示正確的字段名稱。

4.表中沒(méi)有空行和空單元格

表中的所有數(shù)據(jù)之間不能有空行,以便使所有數(shù)據(jù)位于一個(gè)連續(xù)的范圍之內(nèi)。更重要的是,表中不能有空單元格。如圖2-4(a)所示,即使幾種商品具有相同的分類名稱,但是在“類別”列中也不能使單元格為空,而必須重復(fù)填入相同的類別名稱,如圖2-4(b)所示。

圖2-3 表中不應(yīng)該包含聚合數(shù)據(jù)

圖2-4 表中不能有空單元格

主站蜘蛛池模板: 汝阳县| 新丰县| 瑞丽市| 濉溪县| 策勒县| 浠水县| 崇义县| 河西区| 青川县| 孝义市| 瓮安县| 孝义市| 齐齐哈尔市| 宁夏| 兰州市| 乐至县| 拜泉县| 富阳市| 桑植县| 镇康县| 志丹县| 鸡泽县| 扎赉特旗| 乐昌市| 宁明县| 达州市| 合阳县| 天峻县| 叶城县| 开原市| 宝清县| 视频| 黑水县| 临武县| 福清市| 公主岭市| 杭州市| 景泰县| 祁阳县| 科技| 龙里县|