官术网_书友最值得收藏!

前言

大概在三十年前,還是在上大學的時候,從一本日語語言學的文獻中讀到有人嘗試使用統(tǒng)計學的方法研究有關莎士比亞及其作品爭論的課題。這是第一次聽說莎士比亞是否確有其人居然還存在爭論。聯(lián)想到中國大量的古典文獻也存在類似問題,特別是《紅樓夢》的作者問題,不但一直是紅學界爭論不休的熱點,甚至因電視劇《紅樓夢》的熱播,也成了中國社會關注的對象,于是就想,難道沒有一個科學的方法能夠解決此類問題嗎?恰好當時數(shù)學課程正在講“概率論和數(shù)理統(tǒng)計”,便對用統(tǒng)計學方法研究佚名作品的作者問題產(chǎn)生了興趣。當然,當時并不知道什么是文體學,更不知道還有計量文體學這門學問。我對文體學有系統(tǒng)認識是在碩士研究生時代。當時洛陽外國語學院的張云多教授開設了“文章論·文體論”,這門課系統(tǒng)介紹了文體學這門學問,同時也介紹了日本學者關于文體學研究方面的成果和方法。張云多教授也是我碩士時候的授業(yè)恩師。由于計量文體學研究需要進行大量數(shù)據(jù)的統(tǒng)計分析,而20世紀八九十年代獲取文本數(shù)據(jù)比較困難,雖然具備從事這項研究所需的基本數(shù)學知識和計算機技術,但是,終因時代和數(shù)據(jù)條件的限制,這項研究暫時被擱置起來了。但是,我對計量文體學研究的興趣始終未減,而且一直關注著日本在這方面研究的進展。

進入21世紀后,隨著信息技術的進步和互聯(lián)網(wǎng)的普及,數(shù)據(jù)的獲得比較容易,文本數(shù)據(jù)的分析和挖掘研究受到廣泛關注。世界上計量文體學領域的研究也有了長足的進步,日本就出版了一系列這方面的著作,而且出現(xiàn)了多位這方面研究的專家,比如同志社大學的村上征勝教授、金明哲教授就是這些專家學者的杰出代表。國內(nèi)雖然也有一些學者在開展這方面的研究,但還是相對比較薄弱,我們甚至看不到一本系統(tǒng)介紹利用計量的方法研究中文文體習慣的專著。

文體計量研究有一個非常相似的研究領域,那就是文章的剽竊研究。國內(nèi)因?qū)W術評價的需要有很多學者在研究學術論文的剽竊問題,這方面的成果非常豐富。學術剽竊問題研究也是研究文章的相似性問題,這和文體研究密切相關但又有嚴格區(qū)別。文章的相似性實際上包括兩個方面,一是文章內(nèi)容和觀點的相似性,二是文章寫作風格的相似性。通常學術剽竊主要是在自己的文章中抄襲別人文章的內(nèi)容和觀點,為了掩蓋其抄襲行為通常會將別人的觀點用自己的語言描述出來,說成是自己的。這種情況下,雖然內(nèi)容觀點是別人的,但是由于是用自己的語言表述的,所以存在學術剽竊嫌疑的文章通常是內(nèi)容觀點同別人的相似,但是文章所體現(xiàn)出來的寫作風格卻與別人不同。當然,如果是不加掩飾的全文抄襲,則不但內(nèi)容觀點相同,而且寫作習慣也相同,這種情況是徹頭徹尾的剽竊。與剽竊研究不同,文體研究的一個主要目標是要鑒別作品的真?zhèn)螁栴}。模仿別人的習慣和風格寫作,古來有之,有的是善意的,有的是惡意。如《紅樓夢》的續(xù)寫,作者為了能夠讓這部不朽之作有一個完整的結局以滿足讀者欣賞的需要,這個出發(fā)點不能說是不好的。而如今充斥網(wǎng)絡的匿名文章、匿名信,卻沒有這樣的初衷,這些東西往往會模擬別人的口吻和風格,進行造謠、污蔑和對他人進行人身攻擊。這些行為有很多是惡意的。無論初衷是善意的還是惡意的,這些文字產(chǎn)品都會給社會留下困惑,有的需要對其作者進行鑒別。這就需要分析內(nèi)容不同的文章所體現(xiàn)出來的寫作習慣和寫作風格的相似性。

研究學術剽竊和研究模擬別人寫作風格的作品其實存在實質(zhì)性不同。學術剽竊主要研究文章內(nèi)容和觀點的相似性,需要考察的對象是文章中反映文章內(nèi)容和作者觀點的語言表達形式以及利用這些語言表達形式來判斷論文相似度。而計量文體學研究的對象是文章中能夠反映文章作者寫作風格和寫作習慣的語言表達形式以及以此來判斷不同文章是否具有相同的寫作習慣、是否出自同一人之手。這兩種研究都有非常高的實用價值,前者可以用以鑒別學術不端,而后者可以用以鑒別偽作。

人們普遍使用計算機寫作的今天,甄別電子文本的真?zhèn)我呀?jīng)不能夠僅依靠筆跡這種傳統(tǒng)的證據(jù),作者寫作習慣的分析將是電子文本真?zhèn)畏治龅闹匾侄巍O嘈烹S著大數(shù)據(jù)理念的提出和數(shù)據(jù)分析技術的進步,這種用計量的方法進行文體研究的學問將會越來越受到人們的關注,同時計量文體學的方法手段將會在很多領域得到應用。基于以上想法,我覺得自己有責任盡自己的能力將有關計量文體學研究的基本知識和理論梳理出來奉獻給國內(nèi)讀者,盡管我在這方面的研究和認識是很膚淺的。2011年初我入選教育部“新世紀人才支持計劃”,作為本人在該計劃支持下的重要研究內(nèi)容,我真正開始了利用計量方法研究文體的工作。經(jīng)過3年多的努力,終于完成了拙著《計量文體學導論》。從統(tǒng)計的角度講,有很多統(tǒng)計學方法可以在文體計量研究中得到應用,特別是多變量分析的方法層出不窮,本書中所涉及的是最基本的,目的是讓讀者對計量文體學有一基本認識。關于一些復雜方法的應用讀者可在自己的研究中進行深入探討。文體的計量研究至少涉及語言學、文學、數(shù)學、計算機信息處理技術等領域,屬典型的跨學科交叉研究領域,限于本人能力和知識的限制,書中難免存在諸多疏漏、不足,希望能夠得到廣大讀者的批評指正。同時,也希望拙著能夠起到拋磚引玉的作用,能夠吸引更多的學者投入到計量文體學研究領域中來。

2016年初,承蒙彭廣陸教授的厚愛和努力,北京大學出版社接受了拙著的出版申請。在北京大學出版社蘭婷老師的鼓勵和幫助下,又承蒙彭廣陸教授、陳小明教授的推薦,本書通過北京大學出版社申請了北京市社會科學理論著作出版基金資助并獲得了成功。在此向在拙著出版過程中給予幫助的專家、學者和朋友們表示衷心的感謝!本書的出版還與父母、家人的理解、支持是分不開的。特別是妻子和孩子,正是因為有她們在后面默默的付出和努力,我才得以專心致力于此項研究,順利地完成書稿的寫作。值此書出版之際也向親人們表示由衷的感謝。

施建軍

2016年6月19日于北京

主站蜘蛛池模板: 马边| 朝阳市| 巧家县| 博乐市| 阜城县| 武定县| 黑龙江省| 张家川| 南安市| 前郭尔| 黄梅县| 香港| 顺义区| 汉寿县| 昌平区| 临江市| 南充市| 甘孜| 志丹县| 西峡县| 丰都县| 娄底市| 西城区| 卢湾区| 壶关县| 邢台县| 阿尔山市| 云霄县| 阳城县| 页游| 栾城县| 沁水县| 福泉市| 沾益县| 淮安市| 磴口县| 霍山县| 临猗县| 江口县| 大关县| 烟台市|