官术网_书友最值得收藏!

科學的方法

好奇心、懷疑精神和謙遜三者相結(jié)合的科學態(tài)度是所有科學的基礎(chǔ)。心理學家們用科學的方法來武裝他們的科學態(tài)度,這是一個通過觀察和分析來評估觀點的自我修正過程。心理科學歡迎直覺和聽起來很有道理的理論,并對它們進行檢驗。如果一個理論是有效的,即數(shù)據(jù)支持其預測,那對這個理論來說就更好了;如果預測失敗,該理論就會被修改或否定。研究人員向科學期刊提交研究成果時,同行評審員(該領(lǐng)域的其他科學家)會對其研究的理論、原創(chuàng)性和準確性進行匿名評估。有了這些反饋,期刊編輯才能決定該研究是否值得發(fā)表。

構(gòu)建理論

學習目標問題 1-3 理論如何推動心理科學的發(fā)展?

日常對話中,我們常用“理論”這個詞來表示“單純的直覺”。例如,有人可能認為進化論“只是一種理論”,好像它只是一種猜測。在科學領(lǐng)域,理論(theory)會提供一套想法來組織觀察結(jié)果,從而解釋行為或事件。理論通過運用更深層次的原理整合零散的事實,起到歸納和簡化的作用。當我們將觀察到的數(shù)據(jù)點聯(lián)系在一起時,一個連貫的畫面便呈現(xiàn)出來。

理論:一種解釋,使用一套整合原則來組織觀察結(jié)果并預測行為或事件。

例如,一個關(guān)于睡眠影響記憶的理論,能夠幫助我們將無數(shù)與睡眠有關(guān)的觀察結(jié)果整合為數(shù)條簡短的原則。假如我們通過多次觀察得知,睡眠習慣良好的人在課堂上通常表現(xiàn)優(yōu)異,在考試時也能發(fā)揮良好,那么我們可能會推斷:睡眠可以提高記憶力。到目前為止,這一理論運用的效果還不錯,我們巧妙地總結(jié)了一系列關(guān)于良好睡眠的觀察結(jié)果。

然而,無論一個理論聽起來多么合理(例如良好睡眠能提高記憶力似乎很合理),我們都必須對它加以檢驗。一個好的理論做出的預測是可檢驗的,這種預測也被稱為假設(shè)(hypothesis)。這種預測會指明哪些結(jié)果能夠支撐該理論,哪些結(jié)果會否定它。為檢驗睡眠影響記憶的理論,我們可以假設(shè)睡眠不足時,人們對前一天的記憶會下降。為了驗證這一假設(shè),我們可以評估人們在睡眠良好或睡眠不足的情況下對所學教材的記憶程度(圖1.2)。檢驗結(jié)果要么支持這一理論,要么會讓我們對其進行修改或否定。

假設(shè):一個可檢驗的預測,通常由某個理論產(chǎn)生。

圖1.2 科學的方法

一個提出問題和觀察結(jié)果的自我修正過程。

理論會使觀察結(jié)果產(chǎn)生偏差。當我們推斷良好的睡眠會改善記憶效果時,我們可能只看得到自己所期望看到的,從而判定犯困的人說的話不太準確。無論是在實驗室內(nèi)還是實驗室外,我們都強烈地想要看到自己所期望的東西,正如人們對氣候變化的看法影響了他們對當?shù)靥鞖獾慕忉尅?/p>

操作性定義:對于一項研究所使用的確切程序(操作)措辭嚴謹?shù)穆暶鳌@纾说闹橇梢员徊僮餍远x為智力測試所衡量的東西(也稱為操作化)。

心理學家們在報告研究時,對研究程序和概念給予了精確且可度量的操作性定義 (operational definition),以此作為對自己偏見的檢查手段。例如,可以將睡眠不足定義為比該個體的自然睡眠時間“至少少兩小時”。(同理,對“攻擊性”的研究可以觀察你在象征實驗伙伴的玩偶娃娃上扎了多少針,或者對“助人為樂”的研究可以記錄你的捐款數(shù)額。)通過這些措辭嚴謹?shù)谋硎觯渌丝梢杂貌煌膮⑴c者、材料和環(huán)境來復制(replicate)原始觀察。如果他們能夠取得類似結(jié)果,那么人們對該發(fā)現(xiàn)可靠性的信心就會大大增加。例如,對后視偏差的首次研究引起了心理學家的好奇。而現(xiàn)在,在不同的人身上針對不同的問題進行了多次成功的復制實驗后,人們證實了后視偏差。復制是進行確認的手段。

復制:對研究的本質(zhì)進行重復,通常是在不同情況下選用不同參與者,以驗證該基本發(fā)現(xiàn)是否可以被復制。

復制是科學的重要組成部分。心理學曾經(jīng)歷過一場“可復制危機”,即多個實驗室對多達100項研究進行復制,產(chǎn)生了不同的結(jié)果,各個研究的可復制率從36%到85%不等(Camerer et al., 2018a; Klein et al., 2014, 2018; Open Science Collaboration, 2015)(本書并未呈現(xiàn)這些不可復制的研究結(jié)果)。研究樣本較小時,結(jié)果往往很難復制,所以心理學家們越來越多地使用大樣本研究(Camerer et al., 2018b; Sassenberg & Ditrich, 2019; Stanley et al., 2018)。樣本更大,結(jié)果可復制的可能性也更大。

如今的心理學研究受益于更高的可復制率、更多的研究數(shù)據(jù)共享,以及更加嚴格的研究方法(Dougherty et al., 2018; Smaldino & McElreath, 2016; Zwaan et al., 2018)。越來越多心理學家通過預注冊(preregistration)來公開交流自己計劃的研究設(shè)計、假設(shè)、數(shù)據(jù)采集和分析方法(Nosek et al., 2018)。(這種公開透明的制度也防止了后期修改,如改變假設(shè)來適應數(shù)據(jù)。)而探索性研究仍有一席之地,調(diào)查人員可以收集數(shù)據(jù),并尋找可以激發(fā)理論的模式,然后通過確認性研究(預注冊的假設(shè)和預計劃的分析)來對理論進行測試。

預注冊:公開交流計劃的研究設(shè)計、假設(shè)、數(shù)據(jù)采集和分析方法。

探索、復制、預注冊和原始數(shù)據(jù)的開放共享正在實現(xiàn)一場改善科學實踐的“心理學的文藝復興”(Motyl et al., 2017; Nelson et al., 2018)。

心理學和醫(yī)學也利用了元分析的力量。元分析(meta-analysis)是一種用統(tǒng)計學方法綜合大量科學證據(jù)的程序。通過綜合許多研究的結(jié)果,研究人員避免了樣本小的問題,并得出了最終結(jié)論。

元分析:對多項研究結(jié)果進行分析以得出總體結(jié)論的一種統(tǒng)計程序。

“復制失敗不是錯誤,而是一項壯舉,正是它引導我們走上奇妙曲折的科學發(fā)現(xiàn)之路。”

——麗莎·費爾德曼·巴雷特

最后,如果我們的理論能夠(1)整合觀察結(jié)果和(2)給出任何人都能用來檢驗理論或推導實際應用的假設(shè),那么它將是有用的(例如,是否能根據(jù)人們的睡眠狀況預測他們的記憶保持程度呢?),最終我們的研究可能還會(3)刺激進一步的研究,從而得出能夠更好地組織和預測的修正后的理論。

接下來,我們將會學習通過描述法(通常通過案例研究、調(diào)查或自然觀察來描述行為)、相關(guān)法(將不同因素聯(lián)系起來)和實驗法(控制因素以發(fā)現(xiàn)其影響)對假設(shè)進行檢驗,并對理論加以完善。為了對流行的心理學主張進行批判性思考,我們需要了解這些方法,以及它們所能得出的結(jié)論。

檢索練習

RP-2 一個好的理論能夠做到什么?

RP-3 為什么復制很重要?

答案見附錄D

描述

學習目標問題 1-4 心理學家如何通過案例研究、自然觀察和調(diào)查來觀察和描述行為?為什么隨機抽樣很重要?

任何科學的出發(fā)點都是描述。在日常生活中,我們常會觀察和描述他人,總結(jié)他們?yōu)槭裁磿羞@樣的想法、感覺和行為。心理學家也是如此,只不過是通過以下方式更加客觀系統(tǒng)地進行的:

? 案例研究(深入分析個人或群體)。

? 自然觀察(記錄許多人的自然行為)。

? 調(diào)查和訪談(向人們提問)。

案例研究:一種描述性技術(shù),該技術(shù)對個體或群體進行深入研究,旨在揭示出普遍原理。

案例研究 作為最古老的研究方法之一,案例研究(case study)對個人或群體進行深入研究,希望能揭示所有人的真實情況。請看下列例子:

弗洛伊德和小漢斯

對5歲的漢斯極度怕馬的案例的研究,令西格蒙德·弗洛伊德得出了他的兒童性行為理論。他推測,漢斯對母親存在無意識的欲望,害怕被父親這一競爭者閹割,于是將這種恐懼轉(zhuǎn)變成害怕被馬咬的恐懼癥。正如本書第14章的解釋,今天的心理科學不認可弗洛伊德的兒童性行為理論,但確實同意人類的大部分思維都在我們的意識之外運作。

? 腦損傷。我們對大腦的早期認識大多來自對某一腦區(qū)遭受特殊損傷的人的案例研究。

? 兒童的思維。讓·皮亞杰(Jean Piaget)僅在仔細觀察和詢問了幾個孩子后,就向我們揭示了兒童的思維方式。

? 動物的智力。對各種動物(如黑猩猩)的研究,揭示了它們的理解能力和語言能力。

細致的案例研究有時非常具有啟發(fā)性,它們往往為進一步研究指引了方向。

但非典型的個案可能會對我們造成誤導。無論是在日常生活中,還是在科學領(lǐng)域中,非代表性信息會導致誤判和錯誤結(jié)論。事實上,只要研究人員提到一項發(fā)現(xiàn)(如吸煙者會死得更早:85歲以上的男性有95%不吸煙),肯定會有人提供一則相反的逸事(噢,我有一個叔叔每天抽兩包煙,還活到了89歲)。

戲劇性的故事和個人經(jīng)歷(甚至是心理學案例)會引起我們的注意,并且很容易被記住。記者們最清楚這一點,因此常以重大事件作為他們文章的開頭。故事會令人觸動,但也會產(chǎn)生誤導。下列句子中,你覺得哪句話更難忘呢?(1)“一項對1300個與兒童被綁架有關(guān)的夢境報告的研究中,只有5%的人準確預見了孩子的死亡”(Murray & Wheeler, 1937);(2)“我認識一個人,他夢見他的妹妹出了車禍,兩天后她就被車迎面撞死了”。數(shù)字是令人麻木的,但逸事并不能作為證據(jù)。一個據(jù)稱某人從同性戀轉(zhuǎn)為異性戀的故事并不能證明性取向是可選擇的。正如心理學家戈登·奧爾波特(Gordon Allport, 1954, p.9)所說:“只要有一丁點兒(戲劇性)的事實,我們就急于做出像浴缸一樣大的概括。”

要記住的一點:個案可以得出富有成效的想法。適用于我們所有人的真理,在我們中的任何人身上都可以窺見,但要找到這些普遍真理,我們必須采用其他研究方法。

檢索練習

RP-4 為什么我們不能假設(shè)案例研究總能揭示出適用于所有人的一般原則呢?

答案見附錄D

自然觀察 第二種描述性方法是記錄自然環(huán)境中的各種反應。自然觀察(naturalistic observation)的范圍包括觀察叢林中的黑猩猩社會,攝錄和分析不同文化中的親子互動,記錄學校午餐室里學生坐姿的種族差異。在數(shù)字時代,自然觀察的范圍有所擴大,這得歸功于從社交媒體和谷歌搜索等收集的“大數(shù)據(jù)”。

自然觀察:一種描述性技術(shù),在自然發(fā)生的情境下觀察和記錄行為,而不試圖操縱和控制情境。

直到最近,自然觀察大多仍只是“小科學”,可以用筆和紙來完成,而不需要花哨的設(shè)備和大筆的預算(Provine, 2012)。但是,如今的數(shù)字技術(shù)已經(jīng)將自然觀察升級為大科學。只需要使用人們手機的全球定位系統(tǒng)(GPS),就能調(diào)查人們?nèi)ソ∩矸俊⒖Х瑞^或圖書館的頻率(Harari et al., 2016)。而一些新技術(shù),如可穿戴式相機和健身傳感器,以及連接互聯(lián)網(wǎng)的智能家居傳感器等,為人們提供了越來越多的可能性,使人們得以準確記錄自己的活動、關(guān)系、睡眠和壓力(Nelson & Allen, 2018; Yokum et al.,2019)。

數(shù)十億人在網(wǎng)上輸入個人信息,也使大數(shù)據(jù)觀察(不披露任何人的身份信息)成為可能。一個研究小組曾通過計算來自84個國家的5.04億條推特信息中的各種積極和消極詞匯,來研究人類情緒的起伏(Golder & Macy, 2011)。如文前彩圖1.3所示,人們在周末、起床后不久和晚上似乎會更快樂。(周六晚上通常都很快樂,不是嗎?)另一項研究發(fā)現(xiàn),來自美國1347個縣的1.48億條推文中的消極情緒(尤其是與憤怒有關(guān)的)詞語在預測該縣的心臟病發(fā)病率方面比吸煙率和肥胖率更準確(Eichstaedt et al.,2015)。谷歌幫助我們了解這個世界,而人們對谷歌的使用能夠幫助我們了解他們。例如,通過人們搜索的詞語和查詢的問題可以確定一個地區(qū)種族主義的程度和抑郁癥患者的人口占比。但谷歌搜索也揭示了我們?nèi)祟惖钠毡橄嗨菩裕绮煌瑖业娜嗽谒阉鳌皯言小边@個詞時,都有著相同的對食物的渴望(Stephens-Davidowitz, 2017)。全球各地的人,內(nèi)在都是相似的。

和案例研究一樣,自然觀察并不能解釋行為,只是描述行為。盡管如此,描述仍可能揭示問題。例如,我們曾經(jīng)認為只有人類才會使用工具,而自然觀察發(fā)現(xiàn),黑猩猩有時會先把棍子插入白蟻堆中,然后抽出,吃掉棍子上的白蟻。這種不引人注意的自然觀察為后來對動物思維、語言和情緒的研究鋪平了道路,進而擴大了人們對動物伙伴的了解。通過研究人員的觀察,我們了解到黑猩猩和狒狒也會使用欺騙的手段——心理學家多次看到一只小狒狒假裝被另一只狒狒攻擊,以此作為一種誘騙母親把那只狒狒從食物邊趕走的策略(Whiten & Byrne, 1988)。

自然觀察也能闡明人類的行為。這里有兩個你可能會喜歡的發(fā)現(xiàn):

? 一個有趣的發(fā)現(xiàn)。人們在社交場合發(fā)出的笑聲比獨處時的笑聲多30倍(你有沒有注意到自己在獨處時很少笑?)(Provine, 2001)。

? 文化和生活節(jié)奏。羅伯特·萊文(Robert Levine)和阿蘭·洛倫薩楊(Ara Norenzayan)在1999年通過自然觀察比較了31個國家的生活節(jié)奏,包括步行速度、公共時鐘的準確性等。他們的結(jié)論是:日本和西歐的生活節(jié)奏最快,而經(jīng)濟欠發(fā)達國家的生活節(jié)奏較慢。

自然觀察提供了許多有趣的日常生活快照,但這一方法是在沒有控制所有可能影響行為的因素的情況下施行的。觀察不同地區(qū)的生活節(jié)奏是一回事,但要理解一些人比其他人走得更快的原因是另一回事。然而,描述也具有啟發(fā)性:任何科學的出發(fā)點都是描述。

檢索練習

RP-5 自然觀察的優(yōu)勢和劣勢是什么?

答案見附錄D

調(diào)查:一種描述性技術(shù),用于獲取特定群體自述的態(tài)度或行為,通常通過詢問該群體具有代表性的隨機樣本來實施。

調(diào)查 調(diào)查(survey)著眼于許多情況,要求人們述說自己的行為或意見,其研究范圍包括從性行為到政治見解的方方面面。下列是最近的一些調(diào)查結(jié)果:

? 與20世紀60年代和70年代出生的人相比,20世紀90年代出生的人報告自18歲以來沒有性伴侶的人數(shù)是前者的兩倍(Twenge et al., 2017)。如今這些依戀程度較低的年輕人正在經(jīng)歷一位作家所說的“性衰退”(Julian, 2018)。

? 在24個國家中,每兩個人中就有一個人表示相信“宇宙中存在外星智慧文明”(Lampert, 2017)。

? 68%的人類(約52億人)稱宗教在他們的日常生活中很重要(Diener et al.,2011)。

但是,如何提出問題是個棘手的難題。人們可能會掩飾自己的答案,使之更符合社會期望,比如少報告香煙消費或多報告投票行為。而答案往往取決于問題的措辭和對被調(diào)查者的選擇。

措辭的影響 即使是提問順序或措辭的微小變化都會令調(diào)查結(jié)果產(chǎn)生很大的差異(表1.1)。美國福音派白人基督徒被問及(1)“人類是否隨著時間的推移而進化”或(2)“人類從一開始就以其目前的形式存在”時,只有32%的人表示相信進化論(Funk, 2019)。但被問及是否相信(1)“人類隨著時間的推移,由于自然選擇等過程而進化,上帝或更高的力量沒有參與這個過程”,(2)“人類隨著時間的推移而進化,在這個過程中有上帝或更高的力量引導或允許”或(3)“人類從一開始就以其目前的形式存在”,超過兩倍的人(68%)表示相信進化論。措辭是一個非常微妙的問題,批判性思維者會思考問題的措辭如何影響人們的意見表達。

表1.1 調(diào)查措辭的影響

隨機抽樣 日常思考中,我們傾向?qū)谟^察得到的樣本進行歸納,尤其是一些生動的案例。學校管理人員在閱讀(1)學生對某個教授評價的統(tǒng)計匯總,以及(2)兩個憤怒的學生對某個教授鮮明生動的評論時,受到偏倚樣本(2)的影響可能跟受到統(tǒng)計匯總中許多有利評價的影響一樣大,并因此基于幾個生動但不具代表性的案例進行歸納總結(jié)。這種屈從于偏倚樣本的誘惑幾乎無法抗拒。

隨機樣本:能夠公平代表某一群體的樣本,因為每個成員被納入樣本的機會是均等的。

總體:被研究群體的總?cè)藬?shù),可從中抽取隨機樣本(注:除全國性研究外,該術(shù)語指的不是國家人口總數(shù))。

那么,如何才能獲得代表性樣本呢?假如你想了解你所在學院或大學的學生對增加學費的提議有什么看法,通常對整個群體進行調(diào)查是不可能的。那么,如何才能挑選出一個能代表所有學生的群體呢?一般情況下,你可以使用隨機樣本(random sample),這樣總體(population)中每個人都有均等的機會被納入樣本。你可以對學生名單進行編號,并使用隨機數(shù)字生成器來挑選調(diào)查參與者(給每位學生都發(fā)問卷行不通,因為那些自覺交回問卷的人并非隨機樣本)。大型代表性樣本要優(yōu)于小型代表性樣本,但100個小型代表性樣本要優(yōu)于500個非代表性大型樣本。簡單地增加樣本人數(shù)無法彌補樣本代表性不足的缺陷。

在全美范圍的選舉調(diào)查中,政治民意調(diào)查員就是這樣對選民進行抽樣的。如果不進行隨機抽樣,如各種網(wǎng)站的民意調(diào)查之類的大型樣本產(chǎn)生的結(jié)果往往極具誤導性。但是,只需從一個國家所有地區(qū)隨機抽取大約1500人,就能非常準確地反映出全國性意見。此外,民意調(diào)查員還可以詢問一些不相關(guān)的問題,如受訪者是單身還是已婚等,并以政府統(tǒng)計數(shù)據(jù)為基準評估抽樣的準確性(Bialik, 2018)。如果調(diào)查樣本分布能夠與全國人口分類匹配就更好了。

有了大型樣本的幫助,預測結(jié)果會相當可靠。字母E占了梅爾維爾《白鯨》中925 141個字母的12.3%、狄更斯《雙城記》中586 747個字母的12.4%,以及馬克·吐溫的12部作品中3 901 021個字母的12.1%。據(jù)此估計,字母E約占書面英語中字母總數(shù)的12.7%(Chance News, 1997)。

考慮到民意調(diào)查的誤差幅度和最后時刻的選民波動,政治民意調(diào)查對可能的結(jié)果有一定預測作用,但并不完全準確。2016年美國總統(tǒng)大選前夕,民調(diào)分析網(wǎng)站“五三八”預測候選人希拉里·克林頓有71%的勝算。而唐納德·特朗普當選后,許多人都認為這一預測失敗了。但是,預測模型估計一個候選人有71%的勝算時,該候選人也有近三分之一的概率會輸(試想一下,天氣預報預測有70%的可能性會下雨時,當天一直下雨,這一預測也是有瑕疵的)。一項對1942年至2017年間45個國家的3萬個大選預測的總結(jié)是:大選結(jié)果與流行看法相反,民意調(diào)查結(jié)果則相當準確(Jennings & Wlezien, 2018)。

要記住的一點:接受調(diào)查結(jié)果之前,要批判性思考樣本的代表性。代表性隨機樣本是歸納總結(jié)的最佳基礎(chǔ)。

檢索練習

RP-6 什么是非代表性樣本?研究人員如何避免這類樣本?

答案見附錄D

相關(guān)關(guān)系:兩個因素共同變化的程度,也意味著其中任一因素能夠預測另一個因素的程度。

相關(guān)系數(shù):兩個事物之間關(guān)系的統(tǒng)計指數(shù)(從-1.00到 +1.00)。

變量:任何可變的、可測量的,并且對其的測量符合倫理要求的事物。

相關(guān)關(guān)系

學習目標問題 1-5 我們所說的兩件事情相關(guān)是什么意思?什么是正相關(guān)和負相關(guān)?

描述行為是預測行為的第一步。我們常會從自然觀察和調(diào)查中得知,一種特征或行為往往與另一種特征或行為同時出現(xiàn)。在這種情況下,我們會說這兩者是相關(guān)關(guān)系(correlate)。統(tǒng)計指標相關(guān)系數(shù)(correlation coefficient)能夠幫助我們弄清兩個事物共同變化的程度,從而了解其中任一事物能在多大程度上預測另一事物。知道考試分數(shù)與學業(yè)進步的相關(guān)關(guān)系,我們就可以知道分數(shù)能在多大程度上預測學業(yè)進步。

在本書中,我們常會問道,兩個變量(variable)間的相關(guān)有多強?例如,同卵雙胞胎的性格測試分數(shù)間有什么關(guān)聯(lián)?智力測試分數(shù)對職業(yè)成就的預測程度如何?抑郁癥狀能在多大程度上預測人們的焦慮?對于這類情況,散點圖(scatterplot)可以很好地揭示答案。

散點圖:一個由點組成的圖形群,其中每個點代表兩個變量的值。點的斜率表明兩個變量之間關(guān)系的方向。散點的分布表明相關(guān)的程度(散點越集中,表示相關(guān)性越高)。

散點圖里的每個點代表兩個變量的值。圖1.4展示了從完全正相關(guān)到完全負相關(guān)的相關(guān)關(guān)系散點圖(現(xiàn)實世界中,完全相關(guān)非常少見)。如果兩組分數(shù)(如身高和體重)總是一起上升或下降,則為正相關(guān)。

說一個相關(guān)關(guān)系為“負”,并不能說明其相關(guān)的程度。如果兩組分數(shù)變化方向相反,一組分數(shù)上升時,另一組分數(shù)下降,則其相關(guān)關(guān)系為負。例如,人們的身高和其頭頂?shù)教旎ò宓木嚯x之間的相關(guān)關(guān)系是完全負相關(guān)。

圖1.4 顯示相關(guān)關(guān)系的散點圖

相關(guān)性(r)的范圍從+1.00(一個變量的分數(shù)隨另一個變量的分數(shù)增加而增加),到0.00(不相關(guān)),到-1.00(一個變量的分數(shù)隨另一個變量的分數(shù)增加而減少)。

統(tǒng)計能夠幫助人們了解隨意觀察中可能遺漏的東西。為證明這一點,雅庫布·波拉克(Jakub Polák et al., 2019)和同事收集了2291名捷克和斯洛伐克參與者的問卷,要求參與者們用1~7分的量表來評價他們對24種動物的恐懼和厭惡程度。瀏覽表1.2的數(shù)據(jù),你認為參與者對動物的恐懼和厭惡之間的相關(guān)關(guān)系是正相關(guān)、負相關(guān),還是接近于零?

表1.2 參與者對各種動物的恐懼和厭惡程度

在對表1.2各欄進行比較時,大多數(shù)人都沒有發(fā)現(xiàn)恐懼和厭惡程度之間的關(guān)系。事實上,這一假想案例中的相關(guān)關(guān)系是正相關(guān)(r=+0.72),將數(shù)據(jù)以散點圖(圖1.5)形式展示,我們就能看到這一點。

如果數(shù)據(jù)像表1.2一樣系統(tǒng)性地呈現(xiàn)時,我們都很難認識到其中的相關(guān)關(guān)系,那么在日常生活中,我們注意到它們的可能性有多大?為了看清眼前的事物,我們有時需要統(tǒng)計的指引。得到有關(guān)崗位級別、資歷、業(yè)績、性別和工資的統(tǒng)計匯總信息時,我們能夠輕易看出有關(guān)性別歧視的證據(jù)。但是,相同的信息逐一出現(xiàn)時,我們往往看不到歧視(Twiss et al., 1989)。像心理學家一樣思考能夠幫助我們平等地看待每個人,而不僅僅是那些引起我們注意的人。

圖1.5 對24種動物的恐懼和厭惡程度散點圖

本圖展示了參與者自述的恐懼和厭惡程度的平均值(每個平均值都由一個數(shù)據(jù)點表示),圖中顯示出上升斜率,表明兩者之間屬于正相關(guān)。圖中數(shù)據(jù)相當分散,表明相關(guān)性遠低于+1.00。

要記住的一點:相關(guān)系數(shù)體現(xiàn)了兩件事物的關(guān)聯(lián)程度,能夠幫助我們更清楚地理解這個世界。

檢索練習

RP-7 指出下列相關(guān)關(guān)系是正相關(guān)還是負相關(guān)。

1.丈夫瀏覽網(wǎng)絡色情內(nèi)容越多,婚姻關(guān)系越差(Muusses et al., 2015)。_______

2.少女花在網(wǎng)絡社交媒體上的時間越多,患抑郁癥和自殺傾向的風險就越大(Kelly et al., 2018; Twenge & Campbell, 2019)。_______

3.兒童接受母乳喂養(yǎng)的時間越長,后來的學習成績越好(Horwood & Fergusson, 1998)。_______

4.老年人吃的綠葉蔬菜越多,之后5年的智力下降越少(Morris et al., 2018)。_______

答案見附錄D

錯覺相關(guān)和均值回歸

學習目標問題 1-6 什么是錯覺相關(guān)?什么是均值回歸?

相關(guān)性不僅會幫助我們清楚看到可能遺漏的關(guān)系,還會令我們避免錯誤地觀察到不存在的關(guān)系。認為兩件事物之間存在關(guān)系時,我們可能會注意到并回憶起一些能夠證實這一觀點的例子。若是相信夢境內(nèi)容能夠預示現(xiàn)實事件,我們可能注意到并回憶起的相符事例會多于不相符的事例。這正是錯覺相關(guān)(illusory correlation)。

錯覺相關(guān):認為無關(guān)聯(lián)的兩者有關(guān)系,或認為兩者之間存在比實際更緊密的關(guān)系。

均值回歸:極端或不尋常的分數(shù)或事件向平均值回落(回歸)的趨勢。

錯覺相關(guān)會產(chǎn)生一種控制錯覺,令人認為偶然事件受到個人掌控。賭徒回想自己玩幸運骰子的經(jīng)歷,可能會認為自己能夠影響骰子的滾動,輕拋骰子就能得到較小的數(shù)字,而重拋骰子結(jié)果則相反。這種不可控事件與個人行為相關(guān)的錯覺也受均值回歸(regression toward the mean)的統(tǒng)計現(xiàn)象的影響。平均結(jié)果比極端結(jié)果更為典型。因此,在不尋常事件之后,事態(tài)往往會向其平均水平回歸:不尋常事件往往會被更多尋常事件取代。如果學生在測試時的成績比平時低得多或高得多,那么在重測時,他們很可能會回到自己的平均水平。在第一次測試時表現(xiàn)超出隨機水平的超感官知覺(ESP)測試對象,在重新測試時,幾乎都失去了他們所謂的“精神力”。

未能發(fā)現(xiàn)這一回歸是許多迷信和無效做法的根源所在,在體育訓練和工作場所中常會發(fā)生這樣的事。經(jīng)理在斥責了表現(xiàn)比平時差的員工(或運動員)后,當該員工恢復正常水平時,可能會對其“進步”感到欣慰;而在對員工的出色表現(xiàn)大加贊揚后,當該員工再次向平均水平回歸時,則可能會對其感到失望。諷刺的是,回歸平均水平會誤導我們,令我們在批評他人后感到欣慰(“那次批評真的讓他更努力了!”),在贊揚他人后卻感到自責(“那些贊美之詞讓她懈怠了!”)(Tversky & Kahneman, 1974)。

“一旦你對它變得敏感,你會發(fā)現(xiàn)回歸無處不在。”

——心理學家丹尼爾·卡尼曼

要記住的一點:波動變化的行為恢復正常時,關(guān)于其變化的花哨解釋往往是錯誤的,可能是均值回歸在發(fā)揮作用。此外,相關(guān)研究盡管能夠揭示各種關(guān)系,卻并不能解釋它們。如果青少年使用社交媒體與其抑郁風險相關(guān)(預測),這可能意味著使用社交媒體有抑郁風險,但也可能不是這樣,也可能有其他解釋(見“批判性思考:相關(guān)關(guān)系與因果關(guān)系”)。

檢索練習

RP-8 學校籃球教練跟朋友說,上半場比賽,球隊表現(xiàn)非常糟糕,她對球員大喊大叫才保住了球隊的連勝紀錄。球隊表現(xiàn)變好的另一種解釋是什么?

RP-9 婚齡與男性脫發(fā)呈正相關(guān),是否意味著婚姻會導致男性脫發(fā)或者禿頂?shù)哪行詴蔀楦玫恼煞颍?/p>

答案見附錄D

實驗

學習目標問題 1-7 實驗的什么特征使它可以厘清因果關(guān)系?

羅馬詩人維吉爾(Virgil)曾說:“能夠察覺事物原因的人是幸福的。”心理學家如何觀察到相關(guān)研究中的因果關(guān)系,比如未成年少女使用社交媒體與她們患抑郁癥和自我傷害的風險之間小的相關(guān)?

實驗操作 我們的工作從兩個簡單的事實開始:

1. 2010年開始,全球智能手機和社交媒體的用戶激增。

2. 同時,加拿大、美國和英國未成年少女患抑郁癥、焦慮癥,自我傷害和自殺的概率也急劇上升(Mercado et al., 2017; Morgan, 2017; Statistics Canada, 2016)。

這樣的發(fā)現(xiàn)意味著什么?兩者之間是否存在因果關(guān)系?如果是這樣,父母應不應該限制他們上初中的子女使用照片墻(Instagram)或色拉布(Snapchat)的時間?即使是來自一百萬青少年的超大樣本得出的相關(guān)關(guān)系也無法回答我們。答案仍在爭論之中,數(shù)據(jù)得出的結(jié)果也不一致。除了簡單的相關(guān)關(guān)系外,一份研究摘要指出,在八項縱向研究(研究隨時間推移的變化)中有六項研究表明,當前青少年對社交媒體的使用預示了其未來的心理健康問題(Haidt, 2019)。即便如此,為確定原因和結(jié)果,研究人員也必須進行實驗(experiment)。在實驗中,研究人員能夠通過操縱感興趣的因素和保持其他因素不變(即“控制”)來分離出一個或多個因素的影響。為達到這一目的,他們通常會建立一個實驗組(experimental group),讓人們接受操縱,如減少屏幕使用時間,并建立一個人們不接受操縱的對照組(control group),以進行對比。

批判性思考:

相關(guān)關(guān)系與因果關(guān)系

學習目標問題1-8 為什么相關(guān)關(guān)系能夠預測卻無法解釋因果關(guān)系?

1. Belluck, 2013。2. Fielder et al., 2013; Willoughby et al., 2014。3. Resnick et al., 1997。4. 答案:(1)父母的愛可能會讓青少年更健康。(2)表現(xiàn)良好的青少年可能會更多地感受到父母的愛和認可。(3)某些其他因素可能會影響父母的愛和青少年的行為,如家庭收入或社區(qū)環(huán)境。

實驗:一種研究方法,研究人員通過操縱一個或多個因素(自變量)來觀察其對某些行為或心理(因變量)的影響。研究人員旨在通過隨機分配參與者控制其他相關(guān)因素。

實驗組:在一個實驗中接受操縱,即改變某種自變量的組。

對照組:在一個實驗中沒有接受操縱,與實驗組形成對比,作為評價操縱效果的比較組。

隨機分配:通過將參與者分配到實驗組和對照組,從而使不同組之間預先存在的差異最小化。

為使兩組之間預先存在的差異最小化,研究人員將人們隨機分配(randomlyassign)到兩個組中。無論是用隨機數(shù)字表還是拋擲硬幣,隨機分配都能有效地使兩組人是等效的。在一個實驗中,如果有三分之一的參與者可以讓耳朵扭動起來,那么每組中都有大約三分之一的參與者可以做到。年齡、態(tài)度和其他特征在實驗組和對照組中也是相似的。因此,如果在實驗結(jié)束時兩組人有差異,我們就可以推測出操縱有效果(注意隨機抽樣和隨機分配的區(qū)別,前者創(chuàng)造了一個代表性調(diào)查樣本,后者則使實驗組和對照組更加均衡)。

那么,關(guān)于未成年少女使用社交媒體與她們患抑郁癥和自我傷害風險之間的關(guān)系的實驗表明了什么?盡管真正改變社交媒體使用的實驗很少,但在另一個實驗中,有近1700人同意停用他們的臉書(Facebook)賬戶四周時間(Allcott, 2019)。與對照組的人相比,那些被隨機分配到停用賬戶組的人花了更多時間看電視和與家人朋友互動,他們報告的抑郁癥數(shù)量較低,對生活的幸福感和滿意度更高,而且實驗后也更少使用臉書。少玩會兒臉書,生活更加幸福。

人們對長期使用社交媒體的影響爭論不休。目前,大多數(shù)研究人員都認為青少年無限制地使用社交媒體會帶來一定程度的心理健康風險。隨著進行更多大規(guī)模的相關(guān)研究和縱向研究,以及進一步的實驗,研究人員將逐漸完善這一暫定結(jié)論。

要記住的一點:相關(guān)研究揭示了自然發(fā)生的關(guān)系,實驗通過操縱一個因素來確定其影響。

程序和安慰劑效應 那么,考慮一下我們?nèi)绾卧u估治療中的干預措施呢?在生病或情緒低落時,我們傾向于尋求新的治療辦法,而這可能會產(chǎn)生誤導性的證據(jù)。如果我們在感冒三天后開始服用鋅片,發(fā)現(xiàn)感冒癥狀減輕了,我們可能會認為是藥物的功勞,而不是感冒的自然緩解。在18世紀,放血療法似乎很有效,人們有時在接受該療法后會有所好轉(zhuǎn);如果他們沒有好轉(zhuǎn),醫(yī)生就會推斷疾病已經(jīng)到了無法逆轉(zhuǎn)的程度。因此,無論一種療法是否真正有效,使用者都有可能認可它。為了確定其療效,我們必須控制其他因素。

而這正是對新藥和新的心理治療方法進行評估的方式(見第16章)。研究人員將這些研究的參與者隨機分配到各研究小組。一組接受假性治療——使用無藥效的安慰劑(一種外觀相同但不含藥物成分的片劑),而另一組接受真正的治療,如服用抗抑郁藥物。參與者對于他們所接受的治療通常都是“盲目的”,即不知情的。如果該研究采用雙盲測試(double-blind procedure),則參與者、藥物管理者和數(shù)據(jù)收集者都不知道哪一組在接受治療。

雙盲測試:一種實驗測試,在測試過程中,研究參與者和研究人員對研究參與者是否接受了治療或安慰劑都一無所知(盲目)。常用于藥物評價研究。

安慰劑效應:(pluh- SEE-bo;拉丁文,意思是“我將取悅”)僅由期望引起的實驗結(jié)果;使用無效的物質(zhì)或引入無效的條件,參與者由于誤將其當作有效因素而導致的對行為的任何影響。

自變量:在一個實驗中,被操縱的因素;實驗是為研究其變化產(chǎn)生的影響。混淆變量:除被研究的因素外,可能影響研究結(jié)果的因素。

因變量:實驗中被測量的結(jié)果;當自變量被操縱時,可能發(fā)生變化的變量。

在雙盲測試中,研究人員檢查的是治療的實際效果,而非參與者和研究人員對其療效的信念。只要想到自己正在接受治療,就能讓人精神振奮,身體放松,癥狀得到緩解。這種安慰劑效應(placebo effect)在減少精神分裂癥患者的疼痛、抑郁、焦慮和聽覺幻覺方面有大量記錄(Dollfus et al., 2016; Kirsch, 2010)。運動員服用所謂可提高表現(xiàn)的藥物后跑得更快(McClung & Collins, 2007);喝無咖啡因咖啡的人報告稱,在他們覺得飲品中含有咖啡因時,他們的活力和警覺性提高了(Dawkins et al., 2011)。人們服用虛假的情緒改善藥物后感覺更好(Michael et al., 2012)。安慰劑越貴,對我們來說就越“真實”,價格為2.5美元的假藥比10美分的假藥效果更好(Waber et al., 2008)。要真正了解一種療法的有效性,研究人員必須控制可能會出現(xiàn)的安慰劑效應。

檢索練習

RP-10 研究人員采取了什么措施來防止安慰劑效應混淆研究結(jié)果?

答案見附錄D

自變量和因變量 我們接下來看一個更有說服力的例子:藥物萬艾可(俗稱偉哥)在經(jīng)過21次臨床試驗后獲批使用。其中一項試驗是研究人員將329名患有勃起障礙的男性隨機分配到實驗組(服用偉哥)或?qū)φ战M(服用安慰劑)。這個過程是雙盲的,服藥者和發(fā)藥者都不知道參與者服用的是什么。結(jié)果顯示:在峰值劑量下,有偉哥協(xié)助的成功案例占69%,而服用安慰劑的成功案例只有22%(Goldstein et al., 1998)。

這個簡單的實驗只操縱了一個因素:藥物(服用偉哥與未服用偉哥)。我們把這個實驗因素稱為自變量(independent variable),因為我們可以單獨改變它而不影響其他因素,如男性的年齡、體重和個性。其他有可能影響研究結(jié)果的因素被稱為混淆變量(confounding variable)。隨機分配控制了可能的混淆變量。

自變量:在一個實驗中,被操縱的因素;實驗是為研究其變化產(chǎn)生的影響。

混淆變量:除被研究的因素外,可能影響研究結(jié)果的因素。

因變量:實驗中被測量的結(jié)果;當自變量被操縱時,可能發(fā)生變化的變量。

實驗研究了一個或多個自變量對某些可測量行為的影響,并稱其為因變量(dependent variable),這種變量可以根據(jù)實驗中發(fā)生的情況而變化。自變量和因變量都有精確的操作定義,其中規(guī)定了操縱自變量(即本研究中確切的藥物劑量和時間)或測量因變量(即男子對其性表現(xiàn)問題的反應)的程序。這些定義提供了一定程度的準確性,以便其他人能夠重復這項研究(見圖1.6中的臉書實驗設(shè)計)。

隨機分配(控制其他混淆變量,例如人格和環(huán)境)

圖1.6 臉書實驗

為了辨別因果關(guān)系,研究人員通過隨機分配一些參與者到實驗組,另一些參與者到對照組來控制混淆變量。測量因變量(抑郁癥測試分數(shù))以確定自變量(社交媒體接觸)的影響。

讓我們暫停一下,做一個簡單的心理學實驗,確保你理解了內(nèi)容。為了測試房東對租房者種族的感知對其邀請租房者看房的影響,阿德里安·卡普索(Adrian Carpusor)和威廉·羅格斯(William Loges)在2006年的研究中向洛杉磯地區(qū)1115名房東發(fā)送了措辭相同的詢問電子郵件。研究人員改變了發(fā)件人姓名中包含的種族身份信息,并跟蹤研究了積極答復(即邀請他們親自去看房)的百分比。其中,“帕特里克·麥克杜格爾”(Patrick McDougall)、“賽義德·拉赫曼”(Said Al-Rahman)和“泰瑞爾·杰克遜”(Tyrell Jackson)分別收到89%、66%和56%的邀請。在這個實驗中,什么因素是自變量?什么因素是因變量呢?[3]

實驗也可以幫助我們評估社會項目。早期兒童教育計劃能否提高貧困兒童的成功機會?各種反吸煙運動有什么效果?學校的性教育計劃能否減少青少年懷孕的情況?為了回答這些問題,我們可以進行實驗。如果一項干預措施效果極佳,但資源有限時,我們可以用抽簽的方式,隨機分配一些人或地區(qū)體驗新的項目,而其他的人則作為對照組。如果后來這兩組人有差異,那么干預的效果就有據(jù)可依(Passell, 1993)。

“(我們必須防范的)不僅是種族誹謗,而且要…… 防范微妙的沖動,例如給強尼工作面試機會,而不給賈馬爾。”[4]

——美國前總統(tǒng)貝拉克·奧巴馬

讓我們來回顧學過的內(nèi)容。變量是任何可以變化的東西,如嬰兒營養(yǎng)、智力、社交媒體接觸等任何在可行和道德的范圍內(nèi)可以測量的東西。實驗的目的是操縱自變量,測量因變量,并控制混淆變量。一個實驗至少有兩個不同的組:一個實驗組和一個對照或控制組。隨機分配的作用是在任何操縱效果發(fā)生之前,盡量減少各組之間預先存在的差異。這樣,一個實驗至少可以測試一個自變量(我們操縱的因素)對至少一個因變量(我們測量的結(jié)果)的影響。

檢索練習

RP-11 通過隨機分配,研究人員能夠控制______,這是除自變量以外可能會影響研究結(jié)果的因素。

RP-12 將左邊的術(shù)語(i—iii)與右邊的描述(a—c)相匹配。

RP-13 為什么在測試一種控制血壓的新藥時,在1000名參與者中,給一半人服用藥物會比給所有參與者都服用藥物更能了解其效果?

答案見附錄D

研究設(shè)計

學習目標問題 1-9 你如何知道要使用哪種研究設(shè)計?

在本書中,你將學習到心理科學相關(guān)的各種神奇發(fā)現(xiàn)。但是,為得到有意義的結(jié)果,心理學家們會如何選擇研究方法并設(shè)計他們的研究呢?了解研究如何進行,即如何開發(fā)和研究可檢驗的問題,是理解整個心理學的關(guān)鍵。表1.3比較了心理學各種主要研究方法的特點。在后面的章節(jié)中,你將學習到其他研究設(shè)計,包括雙生子研究(第4章)以及橫斷研究和縱向研究(第10章)。

表1.3 研究方法的比較

在心理學研究中,除了無法檢驗(或不道德)的問題外,如自由意志是否存在、人是否生來邪惡以及來世是否存在等,沒有任何問題是不允許研究的。盡管心理學家們無法檢驗這些問題,但他們可以測試自由意志觀點、攻擊性人格以及來世的觀點是否影響人們的思考、感受和行為(Dechesne et al., 2003; Shariff et al., 2014; Webster et al.,2014)。

選定研究問題后,心理學家會選擇最合適的研究設(shè)計,如實驗研究、相關(guān)研究、案例研究、自然觀察、雙生子研究、縱向研究或橫斷研究,并決定如何最有效地對其進行設(shè)置。他們會考慮可用的資金和時間、倫理問題以及其他限制。例如,研究兒童成長的研究人員采用實驗法將兒童隨機分配到溫馨的家庭或嚴厲的家庭中,這種做法是不道德的。

接下來,心理學家會決定如何衡量所研究的行為或心理過程。例如,研究攻擊性行為的研究人員可以衡量參與者是否愿意用所謂的強烈噪聲轟擊陌生人。

研究人員希望對研究結(jié)果更自信,所以還會仔細考慮混淆變量。

心理學研究是一種創(chuàng)造性的冒險。研究人員要設(shè)計每項研究,測量目標行為,闡釋所得結(jié)果,并在此過程中進一步了解行為和心理過程的迷人世界。

自問

你會選擇哪個心理學問題進行研究?你將如何設(shè)計此項研究?

預測日常行為

學習目標問題 1-10 簡化的實驗室條件能闡明日常生活嗎?

在看到或聽到心理學研究時,你是否會好奇,人們在實驗室里的行為能否預示他們在日常生活中的行為?在黑暗的房間里探測微弱的紅光閃爍,是否可以應用于飛機夜間飛行?觀看了暴力色情片后,男性更愿意朝女性按下所謂的播放噪聲按鈕,這是否真的說明觀看暴力色情片增加了男性虐待女性的可能?

回答上述問題之前,我們需要了解,研究人員意圖將實驗室環(huán)境打造為簡化的現(xiàn)實環(huán)境,從而模擬和控制日常生活的重要特征。正如風洞能夠讓飛機設(shè)計師在控制條件下再現(xiàn)氣流的力量,實驗室實驗能夠讓心理學家在控制條件下再現(xiàn)心理力量。

實驗的目的不是精確地復制日常生活中的行為,而是檢驗理論原理(Mook, 1983)。在攻擊性研究中,決定是否按下噪聲按鈕與打人耳光可能不一樣,但原理是一樣的。有助于解釋日常行為的正是由此得出的原理,而非具體的發(fā)現(xiàn)。

心理學家在將有關(guān)攻擊性的實驗室研究應用于實際暴力事件時,采用的是攻擊性行為的理論原理,這些原理是他們從許許多多的實驗中提煉出來的。同樣,研究人員也會將從實驗室環(huán)境的實驗(如在黑暗中看紅燈)中得到的視覺系統(tǒng)原理應用于更復雜的行為,如夜間飛行等。許多調(diào)查表明,實驗室中得出的原理通常可以推廣到日常生活中(Mitchell, 2012)。

要記住的一點:心理科學關(guān)注的不是特定的行為,而是揭示有助于解釋許多行為的一般原理。

主站蜘蛛池模板: 六盘水市| 沅江市| 桑日县| 库车县| 白河县| 桂东县| 镇康县| 宁海县| 茂名市| 偃师市| 金昌市| 六枝特区| 龙川县| 伊川县| 奉贤区| 留坝县| 简阳市| 江达县| 乌鲁木齐县| 阳泉市| 南昌市| 兴仁县| 玉环县| 乐昌市| 台安县| 郧西县| 钦州市| 韩城市| 娱乐| 凌海市| 竹山县| 永康市| 丘北县| 绵竹市| 岑溪市| 安图县| 同心县| 炉霍县| 宁都县| 青神县| 东阿县|