- 電子商務數據庫技術(第3版)
- 潘郁
- 3271字
- 2019-12-11 15:42:21
2.5 電子商務數據庫技術新發展
進入20世紀90年代后,隨著計算機技術應用的發展,數據庫技術也快速發展。數據庫支持的數據模型越來越復雜,不僅包含越來越多的語義,而且還出現許多新的發展方向。例如,各類支持特殊領域應用要求的數據模型的數據庫技術,包括空間數據庫技術、時間數據庫技術、演繹數據庫技術和模糊數據庫技術等,都得到了迅速發展。此外,對數據分散及不同數據類型數據庫互聯的需求推動了分布式數據庫的發展,對CAD、CAM、CIMS、CAI和辦公自動化的需求推動了面向對象數據庫的發展,多媒體技術推動了多媒體數據庫(Multimedia Database, MDB)的發展,聯機分析的需求則引起了數據倉庫技術的發展。本節將簡單介紹數據庫技術的這些新進展。
分布式數據庫系統是地理上或物理上分散而邏輯上集中的數據庫系統。管理這樣的數據庫系統的軟件稱為分布式數據庫管理系統。分布式數據庫管理系統通常由計算機網絡(局域網或廣域網)連接起來,被連接的邏輯單位,包括硬件(如計算機、外部設備)和軟件(如操作系統、數據庫管理系統等),稱為節點或站點。所謂地理上分散,是指各個站點分布在不同的地方。所謂邏輯上集中,是指網絡聯結的各站點共同組成單一的數據庫。
分布式數據庫始于20世紀70年代,繁榮于80年代,在20世紀90年代由于其在分布性和開放性方面的優勢獲得了用戶的青睞。這一切并不是偶然的,一方面是受到應用需求的刺激,另一方面是硬件環境的發展。在應用方面,如銀行的通存通兌及劃匯、全球性民航訂票系統、水陸空聯運系統、連鎖店的管理系統、軍事上的情報系統、旅游訂票系統等,這些應用都涉及地理上分散的統一組織的管理,集中式的數據庫系統已經無法提供合適的支持。在硬件方面,計算機及通信網絡更是突飛猛進的發展。功能日益強大的計算機、微型機和工作站,以及日益廣泛裝備的公用數據網和局域網,為數據庫管理系統的研制提供了一個成熟的、實用的環境。在這兩方面的推動下,數據庫管理系統得到了迅猛發展。現在,分布式數據庫的應用領域已不再局限于聯機事務處理,分布式數據庫技術已經廣泛應用于分布式計算、互聯網應用以及數據倉庫等。
面向對象(Object-Oriented, OO)的數據庫系統是數據庫技術與面向對象技術相結合的產物,它是數據庫的應用從傳統的商業或管理中的事務處理擴展到CAD(Computer Aided Design)、CAM(Computer Aided Manufacturing)及CIMS(Computer Intergrated Manufacturing System)、CAI(Computer Aided Instruction)和辦公自動化等新領域而產生和發展起來的。在這些領域中,傳統的關系數據庫管理系統支持的數據模型的關系太簡單,不能很好地描述這些應用領域的數據結構,因此,面向對象的數據庫就應運而生了。OO數據模型與傳統的數據模型相比具有以下優勢。
(1)具有表示和構造復雜對象的能力。
(2)通過封裝和消息隱藏技術提供了程序的模塊化機制。
(3)繼承和類層次技術不僅能表示is-a聯系,還提供了軟件重用的機制。
(4)通過滯后聯編等概念提供系統擴充能力。
(5)提供與宿主語言的無縫(Seamless)連接。
OO數據模型支持的基本概念包括對象和對象標識、封裝、類型(或類)、繼承、重載、滯后聯編、多態性。OO數據模型支持的基本數據類型較多,從簡單的字符、數字、發展到圖像、聲音、視頻和動畫等多媒體數據。OO數據模型允許用戶定義數據類型,它包括下列類(或對象)的結構機制:聚集(元件)、集合、列表、數據等。任一結構機制都可以作用到任一種對象上,使用戶能定義十分復雜的數據類型(或類),并且能夠描述關系很難、甚至之前不能描述的新應用領域中的數據。
面向對象的數據庫管理系統也具有傳統的數據庫管理系統所具有的功能,如并發控制、用戶及授權管理、從故障中恢復等。但僅僅這樣是不夠的。傳統的事務一般在零點幾秒到幾秒之內完成一事務對數據的處理,事務具備原子性、持久性以及可串行性等特殊性質;而新的應用技術(如CAD、CAI等)的數據處理可以持續幾個小時、幾天,甚至更長,它們使得傳統的事務處理技術不再適用,而需要新的事務模型(如長事務、嵌套事務等)。所以,面向對象的數據庫管理系統還應當支持長事務處理和嵌套事務,以便當故障發生時不至于回滾整個事務。
面向對象的數據庫系統所面臨的問題是,建立一個健全的、商用的、面向對象的數據庫系統開銷很大,所以其必須能在現有的關系數據庫中直接使用,而不是花很大的代價去轉換,盡管目前已有大量的研究開發工作,有一些可支持的面向對象數據庫系統,但面向對象數據庫的成熟仍存在許多亟待解決的問題。當前的許多研究都是建立在數據庫已有的成果和技術上的。針對不同的應用,對關系數據庫管理系統進行不同層次上的擴充。
當今社會存在著各種形態的信息,計算機要以圖形、印刷文字、手寫文字、聲音、圖像、動畫和身體語言等多種媒體作為處理對象。能夠管理數值、文件、表格、圖形、圖像、聲音等多媒體的數據庫稱為多媒體數據庫。近年來,大容量光盤、高速CPU、高速信號處理器以及寬帶網絡等硬件技術的發展為多媒體技術的應用奠定了基礎。對多媒體數據庫管理的應用主要有以下三種方式。
(1)基于關系模型,加以擴充,使之支持多媒體數據庫類型。
(2)基于OO數據模型來實現對多媒體信息的描述和操作。
(3)基于超文本模型。
針對多媒體信息的特點,多媒體數據庫一般支持以下特殊功能。
(1)支持圖形、圖像、動畫、聲音、動態視頻和文本等多媒體字段類型及用戶定義的特殊類型。
(2)支持定長數據和非定長數據的集成管理。
(3)支持復雜實體的表示和處理,要求有表示和處理實體間復雜關系(如時空關系)的能力。
(4)有保證實體完整性和一致性的機制。
(5)支持同一實體的多種表現形式。
(6)具有良好的用戶界面。
(7)支持多媒體的特殊查詢及良好的接口處理。
(8)支持分布式環境。
多媒體數據庫系統的關鍵技術包括以下幾種。
(1)數據模型技術,如OO數據模型、語義數據模型等。
(2)數據的存儲管理和壓縮/解壓技術。
(3)多媒體信息的再現和良好的用戶界面技術。
(4)多媒體信息的檢索與查詢及其他處理技術。
(5)分布式環境與并行處理技術。
快速、準確、高效地收集和分析信息是企業提高決策水平和增強企業競爭力的重要手段。企業的數據就像埋藏在深山中的金礦,如果不能供企業決策人員使用,就不能充分發揮其應有的價值。建立以數據倉庫技術為基礎,以數據庫的聯機分析處理技術和數據挖掘技術為實現手段的決策支持系統是解決上述問題的一種行之有效的系統化解決方案。
數據倉庫利用計算機和數據庫技術的最新進展,它不僅面向復雜的數據分析以支持決策過程,而且可以集成企業范圍內的數據,無論其地理位置、格式和通信要求。數據倉庫把支持決策的數據進行收集、歸納、整理,使企業的業務環境和信息分析環境分離,從而有效地提供實時的信息服務。數據倉庫不是單一的產品,而是由軟、硬件技術組成的環境,它把各種數據庫集成為一個統一的數據倉庫,并且把各種數據庫中的數據進行合理的重組、轉換和集成,以適應數據倉庫面向主題的要求。
聯機分析處理技術以超大規模數據庫或數據倉庫為基礎來對數據進行多維化和綜合分析,構建面向分析的多維數據模型,再使用多維分析方法,從若干不同角度對多維數據進行分析、比較,找出它們之間的內在聯系。聯機分析處理技術使分析活動從方法驅動轉向了數據驅動,分析方法和數據結構實現了分離。
數據挖掘是從大型數據庫或數據倉庫中發現并提取深藏于其中的信息的一種新技術,目的在于幫助決策者找尋數據間潛在的關聯,發現未被注意的信息,而這些信息對預測趨勢和決策行為或許很有用。數據挖掘技術涉及數據庫、人工智能、機器學習和統計分析等多種技術。數據挖掘技術能從數據倉庫中自動分析數據,進行歸納性推理,從中挖掘潛在的模式或產生聯想,建立新的業務模型,幫助決策者做出正確的決策。
數據倉庫、聯機分析處理技術和數據挖掘是三種獨立的信息處理技術。數據倉庫用于數據存儲和組織,聯機分析處理技術集中于數據分析,數據挖掘則致力于知識的自動發現。它們可以分別應用到信息系統的涉及和實現中,以提高相應部分的處理能力。在現代電子商務決策支持系統解決方案中,這三種技術的綜合是最有前途的選擇。