官术网_书友最值得收藏!

1.2.3 社科文獻信息檢索

1.文獻檢索工具

人類的知識浩瀚博大,一個人除了掌握其中的一小部分外,其余大量的知識仍要借助各種工具書才能迅速地獲得。工具書是圖書中較為特殊的一類,從使用角度看,圖書可分為兩類,一類是閱讀性圖書,它主要是供人們系統閱讀、以獲取知識為目的而編著;另一類則是供人們查找特定文獻信息資料、按特定體例編排的圖書,即工具書。工具書的特點是內容概括、信息密集、知識成熟、編排合理、查檢方便。工具書雖不以供人們系統閱讀為目的,但使用性強,是人們求知治學、解疑釋惑不可缺少的工具。

紙質工具書一般又分為兩類。一是檢索工具書,它對特定的資料進行加工、整理,并按一定的方式編排文獻的線索與出處,即檢索工具書不直接向人們提供所需的文獻資料,只提供文獻的線索而已,用戶再根據有關的線索去查找所需的文獻。檢索工具書主要有書目、索引和文摘等。二是參考工具書,它是根據人們的需要,廣泛匯集一定范圍內比較成熟的知識,按一定規則編排組織的工具書。參考工具書包括字典、詞典、類書、百科全書、政書、年鑒、手冊、名人錄、表譜、圖錄、地圖等。

全文數據庫是一種新的檢索工具,集巨量內容和檢索便捷性于一體,實現了文本內容按多種檢索方式輸出的功能。

2.信息檢索的方法

我們正處在一個傳統紙質文獻與現代數字化文獻信息并存的時代,紙質文獻由于符合人們閱讀習慣等原因,將長期保存并被人們所閱讀和使用,而文獻的數字化是發展的大趨勢,海量的數字資源滿足了人們對文獻信息快速索取的需求。針對以上兩種不同儲存形態的文獻,其檢索方法亦有所不同。

廣義上,信息檢索是指將信息按一定的方式組織和存儲起來,并根據信息用戶的需要找出有關信息的過程,即信息存儲與檢索。狹義的信息檢索僅指從信息集合中找出所需信息的過程。按檢索手段的不同,信息檢索可分為手工檢索、光盤檢索、聯機檢索和網絡檢索。按檢索對象形式的不同,信息檢索可分為:(1)文獻型信息檢索,以文獻(包括全文、文摘和題錄)為檢索對象,主要借助于各種書目檢索工具;(2)數值型信息檢索,以數值或數據為檢索對象,如某一數據、公式、圖表、化學分子式等,主要借助于各種數值和統計工具書,特別是數據庫;(3)事實型信息檢索,以某一客觀事實為檢索對象,如某一事件發生的時間、地點等,各種百科全書、手冊、年鑒及全文數據庫是主要的檢索工具。

檢索方法是為實現檢索計劃或方案而采用的具體操作方法和手段。檢索方法有多種多樣,究竟采取哪一種方法應視檢索工具內容編排的特點、性能及用戶需求而定,只有靈活運用各種檢索方法,才能取得滿意的檢索效果。在手工檢索中,常用的檢索方法有以下幾種:一是追溯法,即利用已知文獻的引用文獻或參考文獻查找相關文獻的方法,也稱引文追溯法。根據國外學者的調查研究,該方法是社會科學研究者最常用的一種檢索方法,利用循環追溯檢索,可以查到更多的相關文獻。二是工具法,即利用各種檢索工具進行常規性文獻檢索的方法,是較為常用的文獻檢索方法,只要用戶對某一學科的工具書及其檢索方法有一定的了解,就可以查到大量相關的文獻線索,主要通過題名、著者、分類、主題等途徑來獲取所需的文獻。

網絡環境下的信息檢索主要根據各個數據庫檢索界面所提供的功能而采取不同的方法。20世紀90年代以來,信息爆炸帶來了海量文獻,利用計算機進行存儲和檢索的研究已成為各國研究的一個熱點,發展人工智能的自動分類和主題標引技術對文獻進行處理,有的是基于人工的分類表、主題詞表對數據庫的文獻進行處理,有的則完全以一種新的職能搜索引擎技術來處理海量的網絡信息。目前,各種文獻數據庫的檢索系統仍然是對傳統的人工檢索語言進行綜合、集成,根據數據庫所涉及的文獻的類型相應地架構集中檢索界面和檢索功能。比較常見的檢索功能有:瀏覽、簡單檢索、高級檢索、專家檢索等。

(1)瀏覽(Browse),該檢索功能常見于按學科、刊名字順、出版社名稱瀏覽等(見圖1-1)。

圖1-1 瀏覽檢索

(2)簡單檢索(Simple Search, Easy Search, Quick Search, Basic Search),又稱基本檢索、快速檢索等,檢索界面一般只有一條檢索框,系統默認在全庫或相應的檢索字段中進行檢索(見圖1-2)。若讀者的檢索結果不理想,可利用高級檢索功能。

圖1-2 簡單檢索

(3)高級檢索(Advanced Search),該功能可為用戶提供對應的檢索字段和限定條件,幫助用戶進行精確檢索,檢索結果更加精準和全面(見圖1-3)。有的檢索系統把高級檢索稱為標準檢索。

圖1-3 高級檢索

(4)專家檢索(Expert Search),有的稱為專業檢索(Professional Search),適用于熟悉檢索語言的專業檢索人員,使用專家檢索可以構架復雜的檢索式,獲得確切的檢索結果(見圖1-4)。

圖1-4 專家檢索

構造檢索式是專家檢索的核心,專家檢索有專門的字段代碼表,一些大型的數據庫使用運算符構造復雜的檢索式。數據庫檢索常用以下一些方法來構造檢索式以增強檢索功能,以便在龐大的數據中獲得滿意的檢索結果。

(1)邏輯操作。通過邏輯功能對檢索詞或檢索表達式進行組合是檢索技術的基本功能之一。在計算機檢索系統中一般以AND、OR、NOT分別表示“邏輯與”、“邏輯或”和“邏輯非”,也常用符號*、+、-分別表示。需要著重指出的是一般檢索系統中表示邏輯操作的符號需用英文半角字符,而不能是中文或全角字符,如*、+、-等,在實際使用中應注意輸入法的中、英文輸入法和全角、半角狀態,但也有一些中文檢索系統中可以通用這些表示法。在一些檢索系統中對邏輯操作功能的AND、OR、NOT單詞有大小寫限制,有一些檢索系統則不作限制。例如,需要檢索與“學生英語閱讀能力”相關的內容,可以采用如下檢索式:

學生*英語*閱讀

而如果希望從檢索結果中排除“大學、高?!钡膬热?,則檢索式可修改為:

學生*英語*閱讀-大學-高校

而如果只需要“浙江的中、小學生的英語閱讀”內容,則檢索式可寫成:

浙江*英語*閱讀*(中學+小學)

其中括號意為如四則運算中的計算優先,如果將括號省去,則檢索式的含義變成“浙江的中學生英語閱讀”加上所有只要與“小學生”有關的內容,已不符合原先的檢索需求。

(2)字段限制。字段限制即在特定的字段中檢索符合指定檢索詞的文獻。例如,需要檢索題名(假定以縮寫TI表示)中含有“人文”一詞而主題詞(假定以縮寫SU表示)中含有“浙江”的文獻,檢索大致可表示為:

(TI=人文)*(SU=浙江)

當然,具體的表達式格式會隨檢索系統的不同而有所區別,如字段名稱置于檢索詞的后面,使用其他的符號標記等等。

(3)截詞匹配。截詞匹配功能一般用于檢索與所選檢索詞一部分相符合,其他部分可以是任意字符的場合。根據截詞的位置一般可分為后截、中截和前截。不同檢索系統的截詞符號往往不同,一般采用“? ”或“*”較多,一個表示單字符,另一個表示多字符,具體哪個表示單字符哪個表示多字符隨系統的不同而不同,各個檢索系統的默認狀態是否進行截詞操作也各不相同。

一般后截的應用最多,例如檢索以“企業”一詞開始的所有相關內容,檢索式可寫為:

企業*

則企業文化、企業理念、企業經濟效益等所有以企業一詞開始的詞都是符合的結果。

前截和中截一般在英文的檢索系統中利用較多,例如:

wom? n

則可檢索到符合woman和women的單復數形式的記錄,因此也等同于邏輯或的功能:woman OR women,提高了查全率,當然其中“? ”還可以是其他任何字符,因此往往也同時提高了誤檢率。

(4)詞位限制。詞位限制有時也稱作鄰近檢索功能,也常用于英語檢索系統中,可分為限制檢索詞次序(WITH)及不限檢索詞次序(NEAR),以及限制多個檢索詞在同一句子或段落中出現(SAME)等。例如在Dialog聯機檢索系統中,有如下實現(其中n為1,2,3, …):

A(nW)B

表示A, B兩詞次序不變,但最多只可以間隔n個詞。

A(nN)B

表示A, B兩詞次序不限,但最多只可以間隔n個詞。

在很多系統有如下實現:

A(S)B

表示A, B在同一檢索字段中。當然,在具體的檢索系統中,具體的表達式形式會有所不同。

其他還有一些檢索功能,如用雙引號表示的對詞組的精確檢索,也稱作短語檢索功能,還有如區別英文的大小寫、對檢索詞加權、采用同義詞表等功能,近年來發展較大的還有自然語言解析、語音識別輸入等輔助技術,這些智能化技術的發展應用使人們在使用文獻信息時更加方便有效。

主站蜘蛛池模板: 建昌县| 黄陵县| 涟水县| 曲周县| 乐安县| 通州市| 灵石县| 宁南县| 宜宾市| 竹山县| 玉田县| 尼玛县| 甘孜县| 尚义县| 奇台县| 丰城市| 靖边县| 合水县| 永康市| 蓬安县| 樟树市| 如皋市| 合作市| 磐安县| 江山市| 吐鲁番市| 隆安县| 商河县| 喀什市| 萨嘎县| 德格县| 五指山市| 合山市| 东阳市| 西华县| 汉源县| 筠连县| 嘉鱼县| 雅安市| 大理市| 沐川县|