- 區塊鏈戰爭:科技寡頭和區塊鏈互聯網的未來
- (美)埃文·麥克法蘭
- 1422字
- 2023-12-27 17:13:17
區塊鏈是一個非常復雜且不完美的數據庫
區塊鏈是一個非常復雜的數據庫,盡管現在它經常不只用來指數據庫。為什么這些復雜的數據庫引發了一場全球變革呢?為了理解這個問題,我們可以思考一個類似的例子。當然這個例子不完全恰當,因為它融合了許多不同類型的數據庫,但它有助于闡明區塊鏈的性質。
電子表格(spreadsheet)是一個典型的低級數據庫。你可能已經在里面手動輸入了數據,稍后會用Ctrl+F組合鍵檢索。如果你想使用其他人制作的電子表格中的數據,事情就會變得更加復雜——這時就需要數據庫出場了。一個典型的數據庫看起來和你的電子表格沒什么區別,它可能有100列、1000行,上面還堆棧了100個類似的電子表格。[技術小提示:除了使用Ctrl+F組合鍵從單個單元格中檢索數據,還能用某一版本的結構化查詢語言(Structure Query Language)刪除單元格分組中的三維橫截面數據。]
在過去20年里,數字數據在數量和價值上都發展迅猛,原因顯而易見,本書中均有分析。但是在同一時期內,數據庫的發展幾乎原地踏步,我們在使用數據時仍然沿用20世紀90年代以來的編程邏輯。
數據庫的問題源于數據輸入的端點一般無法得到驗證。一個職員可以把錯別字輸入電子表格,任何有電子表格訪問權限的人都可以隨意操縱數據。數據庫的整體結構也趨于松散,因為它們必須包含丟失的數據和不兼容的數據點。這些錯誤的數據分散在使用數據的每個流程中。
由于我們的工資情況、財產所有權資料、醫療記錄、犯罪記錄以及整個網絡生活都記錄在數據庫中,數據錯誤所引發的后果可能是毀滅性的。即使對于不那么重要的數據,數據庫的局限性也容易產生嚴重的后果。要么機器學習算法無法運行(因為它們無法記錄錯別字),要么不準確的數據將會導致錯誤的分析。
為解決這些問題,我們傾向于投入更多的人力和資源(通常是重復的信息)。人們認為,如果一個數據源有泄露風險,那么要使用約5個不同的數據源來進行交叉驗證。這就是為什么:①你必須經歷重重關卡,才能驗證身份,登錄不同公司的網站;②銀行和信用卡公司需要幾天時間來核驗你的交易信息;③供應鏈在裝運一個集裝箱的過程中,必須將一堆可變文檔傳輸上百次。
區塊鏈是一種完全不同的數據庫,它避免了數據重復。區塊鏈類似于電子表格堆棧形成的數據庫,不同的是,它的區塊就像是更大堆棧中的單個電子表格,而每個區塊之間都由一條“鏈”相連。一條條鏈可以看作是一個個加密鎖,將這些數據塊永遠地保存在恰當的位置上。
把電子表格堆棧視作一個數據庫,當你運行它時,可以說你就在為區塊鏈(而不是一個傳統的數據庫)做貢獻。在區塊鏈中,當你在自己的電子表格中錄入新的數據時,你也在請求將該數據添加到人人共享的電子表格總表中。因此,參與制作電子表格的每一個人都會檢查你錄入的數據。當所有人都對該電子表格的準確性達成共識時,該電子表格就能添加到堆棧中,而整個過程會繼續重復。
在現實的區塊鏈中,電子表格就是區塊:數據由網絡和機器自動添加,而不是由人手動添加的。數據的準確性通過共識機制驗證,而不是由公眾輿論來驗證的。
整個過程中有兩點非同尋常。首先,這些電子表格或區塊中的信息是準確的:沒有打字錯誤、誤差,也不存在主觀性,有的只是原始的事實。其次,任何這種電子表格或區塊數據都不能以任意方式被隨意刪除、復制或質疑。這兩個特性是由區塊鏈整體的透明度和去中心化所決定的。
而這也是區塊鏈的精髓。當然,在這一點上我們忽略了許多技術細節,但中心概念是正確的。然而,即便上述兩個特性極為重要,它們也無法解釋為何技術專家聲稱區塊鏈革命即將到來。