官术网_书友最值得收藏!

一、數(shù)字人文是如何產(chǎn)生的

數(shù)字人文的前身是“人文計(jì)算”(humanities computing),這一命名反映了人們對(duì)此領(lǐng)域的最初認(rèn)識(shí):將計(jì)算機(jī)作為一種新的工具應(yīng)用到人文領(lǐng)域來(lái)解決問(wèn)題。隨著計(jì)算機(jī)技術(shù),尤其是緊隨其后的互聯(lián)網(wǎng)技術(shù)在人類生活中全方位的滲透,信息表達(dá)和信息傳播從傳統(tǒng)的紙質(zhì)媒體向網(wǎng)絡(luò)平臺(tái)全面遷移,人們逐漸認(rèn)識(shí)到計(jì)算機(jī)和網(wǎng)絡(luò)不僅僅是計(jì)算和通信的工具。在金石銘刻、簡(jiǎn)帛抄寫、刻版印刷、機(jī)械印刷之后,人類迎來(lái)了又一次徹底的媒體革命——數(shù)字化、社會(huì)化、智能化的電子媒體時(shí)代來(lái)臨了。

作為文字承載物,傳統(tǒng)物理媒體是靜態(tài)的、被動(dòng)的,而計(jì)算機(jī)這種電子媒體則是動(dòng)態(tài)的、能動(dòng)的。在大量的文本被數(shù)字化之后,人們自然就不滿足于僅僅在電子屏幕上顯示字形符號(hào),而是要充分運(yùn)用數(shù)字媒體的計(jì)算能力對(duì)文本進(jìn)行操作,哪怕它是一部文學(xué)作品。如此,便產(chǎn)生了“人文計(jì)算”。計(jì)算機(jī)最基本也最本質(zhì)的工作原理就是“計(jì)數(shù)”(counting)。因此,人文計(jì)算早期有代表性的工作就是嘗試用計(jì)數(shù)的方法來(lái)解決人文領(lǐng)域的問(wèn)題,特別是那些原本就有爭(zhēng)議的問(wèn)題。例如,1963年蘇格蘭人安德魯·莫頓(Andrew Morton)計(jì)算了《圣經(jīng)·新約》原始希臘文本的每個(gè)篇章的常用詞及其出現(xiàn)頻率,以此作為撰寫風(fēng)格的憑據(jù),進(jìn)而認(rèn)為14篇保羅書信中只有4篇是圣保羅自己寫的。[4]這樣的方法與傳統(tǒng)人文學(xué)者所熟諳的文本細(xì)讀、文學(xué)批評(píng)比起來(lái),似乎過(guò)于簡(jiǎn)單幼稚,因而并不能讓熟讀《圣經(jīng)》的牧師信服。計(jì)算方法,在“人文計(jì)算”時(shí)期,是作為人文研究的輔助工具而存在的。

幾個(gè)世紀(jì)以來(lái)的人文研究都以細(xì)讀經(jīng)典為研究方法。以文學(xué)研究為例,在學(xué)科愈加細(xì)分的學(xué)院傳統(tǒng)里,文學(xué)研究可以按照地域、時(shí)段細(xì)分為若干子領(lǐng)域,每個(gè)子領(lǐng)域都有自己的經(jīng)典,要求學(xué)者專注于自己的專業(yè)領(lǐng)域,細(xì)讀那些文學(xué)經(jīng)典。之所以要按照經(jīng)典性對(duì)作品進(jìn)行篩選,一個(gè)重要的原因在于作品太多,研究者畢其一生都不能窮盡。所以,弗朗哥·莫萊蒂(Franco Moretti)在2000年提出的建立在全部文學(xué)文本之上的世界文學(xué)研究,[5]顯然不是人類可以勝任的工作。人們必須借助計(jì)算機(jī)對(duì)大規(guī)模的文本集合進(jìn)行采樣、統(tǒng)計(jì)、圖繪、分類,進(jìn)而描述文學(xué)史的總體特征,然后再進(jìn)行文學(xué)評(píng)論式的解讀。莫萊蒂為此提出了一個(gè)與“細(xì)讀”(close reading)相對(duì)的概念——“遠(yuǎn)讀”(distant reading)——作為其方法論。雖然細(xì)讀愛好者們?nèi)杂X不妥,但是,除了應(yīng)用計(jì)算機(jī)來(lái)處理全體文學(xué)文本,也找不出其他的辦法了。此時(shí),計(jì)算方法在人文領(lǐng)域取得了不可替代的獨(dú)立地位,一種新的人文研究形態(tài)應(yīng)運(yùn)而生,這就是“數(shù)字人文”。

典型的例子還有哈佛大學(xué)讓-巴蒂斯特·米歇爾(Jean-Baptiste Michel)等人在谷歌數(shù)字化的五百萬(wàn)冊(cè)圖書集合上所進(jìn)行的文化分析學(xué)(culturomics)研究。[6]這一文獻(xiàn)集合約占到人類現(xiàn)有圖書總量的4%,其中僅2000年一年的英文出版物,一個(gè)人不吃不喝不睡也要花上80年才能讀完。研究者對(duì)這一文獻(xiàn)集合進(jìn)行了多種詞匯和詞頻統(tǒng)計(jì),借此分析英語(yǔ)世界200年間的語(yǔ)言現(xiàn)象和文化現(xiàn)象演變。

總結(jié)以上討論,我們認(rèn)為數(shù)字人文產(chǎn)生的背景是:(一)計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)成為泛在的信息基礎(chǔ)設(shè)施,形成了數(shù)字化的媒體環(huán)境;(二)數(shù)字化文本積累到相當(dāng)大的規(guī)模,也就是形成了所謂的大數(shù)據(jù)環(huán)境;(三)計(jì)算分析工具足夠成熟,即便是人文學(xué)者也能夠運(yùn)用。今天,數(shù)字人文已經(jīng)快速演化為一個(gè)極為寬泛的概念,只要是用到計(jì)算機(jī)的、在數(shù)字化的人文材料上進(jìn)行的工作都可以冠以“數(shù)字人文”之名,涉及文學(xué)、藝術(shù)、考古、新聞傳播、圖書館、博物館等領(lǐng)域,幾乎無(wú)所不包。

主站蜘蛛池模板: 绵阳市| 沈阳市| 黎城县| 汉沽区| 渭源县| 剑川县| 重庆市| 延寿县| 娱乐| 苗栗县| 孟州市| 峡江县| 仲巴县| 抚顺市| 郑州市| 富宁县| 天镇县| 昌乐县| 浏阳市| 敖汉旗| 盐源县| 青岛市| 金堂县| 通州区| 响水县| 茶陵县| 武宣县| 峨眉山市| 榆树市| 怀集县| 施甸县| 乐东| 阳高县| 巧家县| 桐梓县| 佛坪县| 温泉县| 台南市| 崇阳县| 松溪县| 江都市|