官术网_书友最值得收藏!

  • 物聯網實戰操作
  • 韋康博
  • 1508字
  • 2019-01-03 05:06:28

6.物聯網兩大應用“神技”

在物聯網的應用技術中,我們只知道云計算和大數據,卻不知道云計算的前身是并行運算,而處理大數據的主要方法是數據挖掘。其實,這兩樣“神技”是物聯網應用領域的核心與支柱。

第一,并行運算。

并行運算又稱為平行運算,顧名思義,此種運算一次可以處理多個工作指令,是相對于串行運算而提出的,目的是提高運算速度,解決大型的計算難題。此外,并行運算也是物聯網建設必不可少的應用技術,為物聯網內部大數據的處理提供了有力的技術支持。并行運算分為兩種,一是時間上的并行,如流水線技術;二是空間上的并行,如多個CPU同時進行同一運算任務。

并行運算的原理就是將問題分成若干個部分,每一部分都由一個獨立的CPU處理,進行并行運算的系統可以是專門設計的多CPU超級計算機,也可以是采取某種連接方式,由若干臺計算機組成的集群。時間上的并行運算多應用于工廠的設備,例如,肉類加工車間對肉類的處理步驟一般包括清洗、消毒、切割和封裝。如果只有串行運算,那么,一個食品完成上述步驟后,才會對另一個食品進行處理,既浪費資源也耗費時間,而采取并行運算的設備就可以同時對每一個食品進行上述步驟,大大提高了計算性能。

空間并行運算多用在重復任務量巨大的領域,例如,某人被要求種三棵樹,如果只是他一個人工作,就需要6小時才能完成,如果他叫來兩個幫手同時工作,則2小時就能完成任務??臻g并行就是將一個大任務分拆成幾個小任務。當然,依靠處理器進行并行運算并沒有想象的那么簡單,需要用到五類并行機:分布式共享存儲處理機、工作站機群、大規模并行處理機、對稱多處理機和并行向量處理機。

值得一提的是,并行計算追求的是高速的計算能力,這依托于昂貴的服務器,一般情況下,一臺領先于世界的高端計算機如果三年內得不到有效利用,它并行運算能力就會落伍。而且并行運算的操作相當復雜,非科研人士很難搞清楚里面的指令,所以,并行運算只用來滿足科學領域的需要,而其衍生物云計算卻成為了普及度非常高的技術,適用于很多領域,也無需考慮服務器的成本??梢赃@么說,并行運算就像是一臺沒有聯網的高性能電腦,而云計算就是一臺聯網的普通性能電腦,兩者互補不足。

第二,數據挖掘。

數據挖掘又稱為數據采礦,一般是指從海量的數據中通過一定的算法搜索出隱藏的重要信息的過程。數據挖掘和計算科學密不可分,并通過統計學、規則識別、專家系統、電腦學習、情報檢索和在線分析處理等多種技術實現其目標。數據挖掘的分析方法有六種,分別為分類、估計、預測、相關性分組、聚類和復雜數據類型挖掘,其系統原型如下圖:

圖2-6-1 數據挖掘的系統原型

數據挖掘一般采用關聯規則法,第一階段就是從所有的數據集合中找出所有高頻的項目組,第二階段則是由這些高頻項目組生出關聯規則。所謂“高頻”,就是指出現的頻率相對于整體記錄較多的一組數據,而一個項目出現的頻率又稱為支持度。例如,有一個包含a與b兩個項目的項目組,我們可以由一個公式得到a、b項目的支持度,若這個項目組的支持度大于預定標準,則a、b為高頻項目組,又稱為高頻K-項目組。在第二階段,利用算法為高頻K-項目組產生規則,若這一規則所得到的支持度達到了最小支持度,則稱此規則為關聯規則。

沃爾瑪超市曾經做過一次關聯數據挖掘,并預設最小支持度為5%,最小信賴度為70%。在挖掘過程中,超市的工作人員發現尿布和啤酒兩類商品符合預設的關聯規則,也就是說,尿布、啤酒項目組的支持度大于等于5%,信賴度大于等于70%。于是可以得出結論,有5%的交易顯示尿布與啤酒被同時購買,而在所有包含尿布的交易中,有70%的交易也包括了買啤酒。這個結論暗示超市工作人員,如果超市中有人購買尿布,就可以同時給他推薦啤酒。這就是數據挖掘的價值所在。

主站蜘蛛池模板: 平和县| 大足县| 宁德市| 宝坻区| 方城县| 双峰县| 太仆寺旗| 定日县| 乌鲁木齐县| 通州市| 通道| 雷州市| 沙坪坝区| 湟源县| 新建县| 奉新县| 嘉兴市| 赤壁市| 乐都县| 寻甸| 临西县| 乃东县| 理塘县| 清丰县| 龙胜| 青海省| 平利县| 法库县| 且末县| 沙河市| 山东| 阿图什市| 湾仔区| 隆安县| 临沂市| 连云港市| 通江县| 平武县| 龙口市| 河北省| 铁岭县|