自然語言處理技術(shù):文本信息抽取及應(yīng)用研究
信息抽取的目的是從海量互聯(lián)網(wǎng)文本信息中抽取結(jié)構(gòu)化知識(shí),是知識(shí)圖譜自動(dòng)化構(gòu)建、更新的基礎(chǔ),為信息檢索、推薦系統(tǒng)、智能問答等諸多研究領(lǐng)域提供底層知識(shí)推理支撐并取得了重大突破,是推動(dòng)人工智能技術(shù)由感知走向認(rèn)知的關(guān)鍵要素,具有重要的研究意義和實(shí)用價(jià)值。本書梳理了命名實(shí)體識(shí)別、關(guān)系抽取、事件抽取等相關(guān)研究方向的知識(shí)資源、基礎(chǔ)理論和實(shí)踐應(yīng)用,詳細(xì)介紹了實(shí)體關(guān)系聯(lián)合抽取、弱監(jiān)督關(guān)系抽取、基于遷移學(xué)習(xí)的關(guān)系抽取、多實(shí)例聯(lián)合事件抽取、基于因變量的事件模板推導(dǎo)等前沿理論研究,并以領(lǐng)域知識(shí)圖譜、事理圖譜等為例,詳細(xì)介紹了信息抽取在圖譜構(gòu)建中的應(yīng)用。最后本書對(duì)信息抽取進(jìn)行了總結(jié)和未來研究方向展望。
·18萬字