1.1 信息概念
1.1.1 信息的概念及其內涵
我們正生活在由工業社會向信息社會過渡的重要歷史轉折時期,有關信息的新名詞、新術語層出不窮,信息產業在社會經濟中所占份額越來越大,信息基礎設施建設與發展速度之快成了我們這個社會的重要特征之一,物質、能源、信息構成了現代社會生存發展的三大基本支柱。那么,如此神通廣大、無處不在、無所不能的信息究竟是什么呢?
可以說,我們周圍的世界充滿了信息。報紙、電臺、電視臺每天都在向我們發送著大量的信息;通過電話、傳真及電子郵件,人們可以自由地交流信息;通過報紙、書刊、電子出版物及因特網等媒介,人們可以有選擇地獲取信息,但以上所述還遠不能概括信息的全部含義。四季交替透露的是自然界的信息,牛頓定律揭示的是物體運動內在規律的信息,信息含義之廣幾乎可以涵蓋整個宇宙,且內容龐雜,層次混疊,不易理清。目前國內外關于信息的各種定義已達近百種,原因就在于此。那么,作為一個科學名詞,如何來定義信息呢?
從最本質的意義上說,信息是人們對客觀事物運動規律及其存在狀態的認識結果。小到一條簡單的消息,大到關于宇宙的基本定律都是信息,它們無不是人們對客觀事物變化規律或存在方式的認識和描述。
信息的價值在于它為人們能動地改造外部世界提供了可能。信息所揭示的事物運動規律為人們運用這些規律提供了可能,而信息所描述的事物狀態也為人們推動事物向著有利的方向發展提供了可能。人們掌握的資源和能量越多,面對同樣的信息能用以改造世界的可能性也越大。今天我們所掌握的物質力量比過去增大了不知多少倍,因此,信息對于當今社會發展和人們生活的重要性較之幾百年前、幾十年前甚至十幾年前都是不可同日而語的,這是信息社會的一個重要特征。
信息運動的一般過程包括信息獲取、信息傳播和信息利用三個階段。信息在這三個階段分別表現為語義信息、語法信息和語用信息等不同的形態。
信息獲取就是利用各種手段獲知事物的運動規律和現存狀態,也就是獲取信息的語義形態,即語義信息。信息獲取的基本手段包括科學研究、調查采訪及利用各種傳感器等。大量科學定律和重要結論是通過科學研究和實驗、利用歸納演繹等科學方法得出的;而新聞報道是通過新聞采訪、調查分析、綜合整理得到的;還有大量信息是利用各種專用傳感器獲取的,如水位計可測定水位,溫度計可計量溫度,攝像機可攝取視頻圖像等,這些都是獲知事物客觀狀態的有效手段。信息獲取過程中還必須克服隨機性(“可能是什么”)和模糊性(“好像是什么”),為此原始信息獲取后往往要進行相應的信息處理過程,以使語義信息凸現出來。
信息傳播是指利用各種傳播工具使每一條信息能為更多的人所了解,相應地,也是使每一個人能獲知更多的信息。從古代的烽火報警到現代的信息高速公路,其目標都是借助于傳播過程使每個接收者獲得盡可能多的語義信息。而語義信息本身是不宜直接傳輸的,我們往往是通過抽象出的某些適于傳輸的最基本特征(即語法信息)使其得到傳遞。若將語義信息比作一棟樓房,那么我們可將它分解為圖紙、材料、施工技術等語法信息,然后將這些語法信息傳送到另一個地方重新組織起來,即可恢復原先的語義信息——樓房。信息傳輸過程主要克服的是隨機性因素,因此,傳輸過程中的語法信息應是指表示信息的各種符號出現的隨機性,以及前后符號之間的統計關聯性。這種分析方法是與傳輸信道的噪聲效果相匹配的,這也正是香農信息理論取得成功的重要原因之一。
信息利用是信息獲取和信息傳播的根本目的,它以恢復的語義信息為基礎,結合接收者所處的特定環境,“取我所需,為我所用”,具有明顯的相對性,表現了信息的語用形態,即語用信息。語用信息的這種相對性往往使信息概念表現得主觀隨意、不易捉摸。如甲、乙二人由于不同的知識結構和社會閱歷,他們讀同一本書所獲取的有用信息可能差別甚大。然而信息利用是信息運動過程的最重要環節,正是對信息的廣泛利用,才推動了世界日新月異的發展變化。
信息是承載在各種具體信號上的。以各種聲、光、電參量表示的信號可承載語法信息。但需注意,信息與信號在本質上是有根本區別的,信號僅僅是外殼,信息則是內核,兩者互相依存,但屬于不同的層次。
信息與消息也不完全相同。消息描述了事物的特征和狀態,因此,它與語義信息有相近之處,但它與語法信息明顯不同,與語用信息也不能等價。消息是信息的感覺媒體,而信號又是消息的具體表現形式。
1.1.2 香農信息定義
1948年,香農在《貝爾系統技術》雜志上發表了名為《通信的數學理論》的著名論文。在這篇論文中,香農用概率測度和數理統計的方法系統地研究了通信的基本問題,給出了信息的定量表示,并得出了帶有普遍意義的重要結論,由此奠定了現代信息論的基礎。
香農針對通信的特點,主要研究信息傳遞過程中的語法信息。香農信息反映的是事物的不確定性。
設q元信源X的概率空間為

則X中符號ai的香農信息定義為

式中,I(ai)稱為ai 的自信息。由式(1-1)可知:ai 出現的先驗概率P(ai)越大,其自信息I(ai)越小;反之,ai 出現的先驗概率越小,其自信息 I(ai)越大。因此自信息I(ai)描述的是隨機事件ai 出現的先驗不確定性。I(ai)與P(ai)的關系如圖1-1所示。

圖1-1 ai 的自信息與其先驗概率的關系
將ai 送上信道后,由于信道中存在干擾,假設接收端收到的符號為 bj,bj 可能與 ai 相同,也可能不同,則條件概率P(ai|bj)反映了接收端收到符號bj而發送端發送為ai的概率,稱之為后驗概率。那么,接收端收到bj后,對發送端是否發送了ai 尚存的不確定性應為,于是,接收者在收到符號bj后消除的不確定性應為ai 的先驗不確定性減去收到bj 后尚存的關于ai的不確定性,即

I(ai;bj)定義為發送ai 與接收bj之間的互信息。
如果信道沒有干擾,則后驗概率P(ai|bj)必為1,即bj 必等于ai,此時尚存在的不確定性,由此可得互信息I(ai;bj)=I(ai),顯然,這樣定義的香農信息是合理的。但需要注意的是:香農信息僅考慮了信息的語法形態,而不涉及語義信息和語用信息,它以事物的不確定性作為信息定義,非常便于利用數學工具進行定量研究,這是香農信息論取得成功的關鍵。