第一章 緒論
第一節 什么是計量文體學
計量文體學(stylometrics,computational stylistics)是研究如何用統計學的方法分析文學作品的文體特征的學問。計量文體學是文體學的一個重要分支,橫跨文學、語言學、數學、計算機科學等眾多學科,為文體研究提供精確、科學的測量方法。計量文體學的任務主要是解決以下幾個方面的問題:
1.特定作家風格的精密計算和描述。
2.宏觀文體(包括新聞報道、廣告、科技說明文、學術論文等功能文體;小說、詩歌、散文等文學文體;口語、書面語、網絡語言等語體)的特征分析和歸類研究。
3.佚名作家作品的作者鑒定。
4.作品年代的測定。
5.作家文體的變化及同一作家作品先后順序的測定。
目前,計量文體學在國內學界有如下多種提法:計算文體學、計算風格學、統計文體學。筆者還是認為用計量文體學更為精確一些。計量文體學不僅要對作家作品的文體特征進行統計,而且要在此基礎上用統計學的原理對作家、作品的文體特征進行分析,甚至要對有效利用文體特征進行分析的統計理論以及統計工具進行研究和開發。另外,計量文體學和計量經濟學的情況基本相似。計量文體學和計量經濟學研究中所使用的統計學理論、方法、工具大多是共通的。計量經濟學的概念已經成為家喻戶曉、耳熟能詳的術語,所以使用計量文體學更容易為大家所接受。