官术网_书友最值得收藏!

自動信息提取 Automated information extraction

文本分析曾經(jīng)是一種非常普通的分析方法,它通過編碼文檔從中提取信息與數(shù)據(jù)。近來,文本分析方法不斷演變,除了文字文本之外,還可以分析音頻、圖像、視頻。由于政府界和學術界的不斷推進,文本分析方法的計算效率在學術界有了一個很大的提升,但在實際應用方面仍存在著很大的缺陷。今天,伴隨著人工智能和其他計算算法的出現(xiàn),文本分析,信息提取將很有可能在實際應用上取得巨大的突破。自動化提取的主要用途之一,是獲得“事件數(shù)據(jù)”(events data),使用時間序列分析、語義分析、隱馬爾科夫模型、微波分析、事件生命周期建模等方法分析“事件數(shù)據(jù)”。這些方法經(jīng)常與其他的方法結(jié)合使用,比如在下一節(jié)中提到的復雜系統(tǒng)理論的方法。除了這些方法,還有許多的自動文本提取算法和系統(tǒng)可以挖掘網(wǎng)絡數(shù)據(jù)結(jié)構(gòu),比如從圖論和社交網(wǎng)絡分析中組合出來。在應用領域,自動信息提取技術由于可以挖掘?qū)崟r的數(shù)據(jù)流,如新聞廣播或其他電子報告,不僅可用于異常檢測和預警,同時也可用于監(jiān)測趨勢和評估干預和項目執(zhí)行等,若自動信息技術再完美些,應該能夠成為日常工作系統(tǒng)升級或運營中心不可缺少的一部分。社會科學領域可以說是文字豐富但數(shù)據(jù)較差,因此自動信息提取技術和文本挖掘技術在該領域有大展身手的空間,如果能合理應用,將來一定會在計算社會科學調(diào)查中取得重大突破。

主站蜘蛛池模板: 新干县| 南雄市| 开江县| 北票市| 阿拉善盟| 汉阴县| 南通市| 陇川县| 万全县| 建阳市| 五大连池市| 文水县| 南安市| 平昌县| 汉中市| 东丰县| 襄城县| 罗定市| 玉树县| 英超| 三都| 门源| 肥乡县| 永和县| 临猗县| 正安县| 广州市| 青岛市| 若尔盖县| 乐山市| 宜春市| 青浦区| 台北市| 会宁县| 卢氏县| 手游| 凤山县| 安图县| 当雄县| 普格县| 深泽县|