自然語言處理技術(shù):文本信息抽取及應(yīng)用研究
信息抽取的目的是從海量互聯(lián)網(wǎng)文本信息中抽取結(jié)構(gòu)化知識,是知識圖譜自動化構(gòu)建、更新的基礎(chǔ),為信息檢索、推薦系統(tǒng)、智能問答等諸多研究領(lǐng)域提供底層知識推理支撐并取得了重大突破,是推動人工智能技術(shù)由感知走向認(rèn)知的關(guān)鍵要素,具有重要的研究意義和實用價值。本書梳理了命名實體識別、關(guān)系抽取、事件抽取等相關(guān)研究方向的知識資源、基礎(chǔ)理論和實踐應(yīng)用,詳細介紹了實體關(guān)系聯(lián)合抽取、弱監(jiān)督關(guān)系抽取、基于遷移學(xué)習(xí)的關(guān)系抽取、多實例聯(lián)合事件抽取、基于因變量的事件模板推導(dǎo)等前沿理論研究,并以領(lǐng)域知識圖譜、事理圖譜等為例,詳細介紹了信息抽取在圖譜構(gòu)建中的應(yīng)用。最后本書對信息抽取進行了總結(jié)和未來研究方向展望。
·18萬字