2.2.4 網絡信息分類
1.網絡信息分類的原則
網絡信息資源的分類體系是根據網絡信息以及用戶的檢索需要而設置的,與紙質文獻信息相比,網絡信息分類有其不同的原則。
(1)直觀性。網絡信息是網站為了用戶的檢索而設立的,其類目設置不宜層次過多,必須體現信息分類的直觀性,讓用戶對其結構一目了然。
(2)實用性。網絡是面對用戶的信息集合,所用的類名一般使用用戶熟知的自然語言,類目層次少,結構簡單易記,以便快速查找。
2.網絡信息分類法的構建
經過近20年的發展,國內外互聯網在網絡信息分類構建方面取得了一定的經驗,主要有:
(1)按需設類,突出重點,便于瀏覽。網站圍繞用戶的使用習慣而設立類目,對于與主題無關的欄目則刪除或不立。網站對于欄目的設立并不完全根據紙質文獻信息類目層次的設置邏輯,而更多根據信息量和訪問頻率。網站始終強調把最有價值的內容放到突出位置,把訪問頻率最高的欄目置于最醒目位置。
(2)以傳統分類主題為基礎,構建多維分類體系。在傳統文獻信息分類法基礎上,根據用戶瀏覽習慣,建立多維分類模式。比如,為了突出重點類目,可以在多個母類下重復出現這一重點類目,一個母類也可以采用多種標準進行劃分。這一做法正是互聯網本身超鏈接優勢的體現——用戶可以從多個入口訪問。
(3)分類主題一體化,網絡信息分類的著眼點是用戶的信息利用需求,因此在類目設置上必須考慮信息分類法與主題詞表的結合,體現分類主題一體化的融合趨勢。
3.網站分類實例
(1)Yahoo!雅虎是最著名的網絡分類網站,創建于1994年,對其后創建的網站在信息組織上有較大的影響,成為各大門戶網的效仿對象。雅虎的信息分類并非一成不變,早期收錄較多的學術信息,而目前則側重于娛樂和生活方面,主頁上的信息按主題分為19個類目:news、sports、finance、weather、autos、fantasy、shopping、makers、parenting、health、style、beauty、politics、movies、travel、tech、TV、celebrity、games。
(2)網易,也是一個分類主題一體化的網站,設有新聞、財經、科技等18個類目,每個類目下又設有眾多的子類目。
當前人工智能研究領域研究重點之一是將人工智能研究領域中的文本自動分類技術應用于信息資源管理。目前,對文本進行自動分類的技術不斷成熟,如基于《中圖法》分類體系下的文本自動分類,其基本做法是,建立基于《中圖法》的專家知識系統,包括《中圖法》庫、《漢語主題詞表》庫、分類號主題詞對應庫、同義詞庫、關鍵詞庫以及人工標引詞庫等若干數據庫或者其中一部分,應用文本自動分類技術,通過對原始數據的有效整理,找出關鍵詞、主題詞和分類號之間隱含的概念關系,形成分類類目與標引詞串的對應款目,自動生成分類號。