- 知識圖譜技術與應用
- 閆樹 魏凱 洪萬福等
- 1220字
- 2020-04-29 16:26:07
前言
在互聯網飛速發展的今天,萬物互聯成為可能,智能分析由只專注于個體轉開始變為更關注個體之間的關系。伴隨著數據處理技術(Data Technology,DT)時代的到來,數據量呈爆發式的增長。在這些海量的非結構化文本數據、大量的半結構化表格和網頁以及生產系統的結構化數據中,蘊含著大量的關系信息。利用知識圖譜技術,人們可以對這些關系信息進行結構化、語義化的智能處理,形成大規模的知識庫,并支撐業務應用,使得機器能夠更好地理解網絡、理解用戶、理解資源,為用戶提供新型智能化服務。
然而,市面上知識圖譜的相關書籍,要么聚焦于科學引文網絡或其他行業應用,要么主要介紹相關工具的使用,專門講述知識圖譜全面理論的書籍還比較少。作者希望以此書的出版彌補這一空白。
本書的主要特色包括:①系統性,從知識圖譜的起源發展入手,層層推進,讓讀者對知識圖譜這一技術工具建立系統的印象;②全面性,既包含通用知識圖譜,也包含行業知識圖譜,內容涉及較廣;③基礎性,本書面向對知識圖譜有興趣的讀者,力求內容通俗易懂;④實用性,理論與實踐相結合,通過案例讓讀者對知識圖譜的應用有直觀的了解。
全書共6章。第一章從定義、發展歷程、架構、特點等方面對知識圖譜進行了基礎性的概念解讀;第二章以知識表示與建模、知識抽取與挖掘、知識存儲與融合、知識檢索與推理4個過程為主線,對搭建通用知識圖譜的技術要素進行了介紹;第三章介紹了行業知識圖譜的特點,并重點研究了知識圖譜在公安、金融、教育、電信、工業領域中的應用場景;第四章對知識圖譜的發展趨勢和挑戰進行了分析;第五章通過醫療決策輔助系統、“虛擬生命”、股份制銀行、禁毒大數據分析平臺4個案例,從痛點難點、實現路徑和應用效果3個方面對知識圖譜的實戰應用進行了解讀;在第六章中,作者列舉了Pajek、CiteSpace等8種國內外較為常用的知識圖譜構建工具,并對各工具的主要功能和特點進行了介紹。
從最初的搜索引擎到現在的聊天機器人、大數據風控、證券投資、智能醫療、自適應教育、推薦系統等,知識圖譜的應用越來越多,它在技術領域的熱度逐年上升。大規模構建并應用知識圖譜,對于互聯網行業、傳統行業甚至社會治理具有重要的意義。隨著理論和技術的不斷發展,學術界和產業界對知識圖譜的認識在不斷地變化與更新。未來,相關的研究和應用的邊界將不斷擴展。
本書的編寫成員包括閆樹、魏凱、洪萬福、錢智毅、王彬、符山、姜春宇。本書在編寫過程中得到了中國信息通信研究院何寶宏所長、張雪麗副所長、劉寒、劉成成、馬鵬瑋、王妙瓊、李雨霏、王卓、李俊逸、呂艾臨等同事的大力支持。廈門淵亭信息科技有限公司、北京明略軟件系統有限公司、中移(蘇州)軟件技術有限公司、中軟國際有限公司、深圳狗尾草智能科技有限公司等企業的專家對本書提出了建議或提供了相關案例,在此對他們一并表示感謝。
由于作者水平有限、編寫時間倉促,書中難免會出現一些錯誤或有爭議的地方,懇請讀者批評指正。如果您有任何建議或遇到了任何問題,歡迎發送郵件至yanshu@caict.ac.cn,期待得到您的反饋。