0%
第11章 偶然性在心理學中扮演的角色

第11章 偶然性在心理學中扮演的角色

偶然性和心理學

事實上,概率定律確保了隨著事件發生次數的增加,一些罕見匹配出現的可能性會變得很大。這一定律不僅允許罕見匹配出現,而且從長遠來看幾乎保證了它的出現。請看馬科斯(Marks,2001)的例子,如果一次擲5枚硬幣,結果它們都是正面朝上,你將認為這是一個罕見匹配,一件不太可能的事情。是的,它發生的概率是1/32或0.03。但是如果你將這5枚硬幣擲100次,再問,在這100次中,至少有一次全部正面朝上的可能性是多少呢?答案是0.96,就是說,100次中,這一罕見匹配是極有可能發生的。
對臨床預測與統計預測的比較研究所得到的結果始終是一致的。自從保羅·米爾(PaulMeehl)的經典著作《臨床預測與統計預測》(Clinica! Versus Statistical Prediction)於1954年出版以來,40年間有超過100個研究表明,在幾乎每一個曾經驗證過的臨床預測領域(精神治療的效果、假釋行為、大學生畢業比例、電擊治療的反應、累犯問題、精神病住院治療期的長短等等),統計預測都優於臨床預測(Dawes,Faust, & Meehl, 1989; Faust, Hart, Guilmette, & Arkes, 1988; Goldberg, 1959, 1968, 1991; Ruscio, 2002; Swetsetal., 2000; Tetlock, 2005)。
世界上的許多事件不能以系統性的因素來完全解釋清楚,至少現在還不能。然而,當一個特定的現象沒有現成的系統解釋的時候,我們頭腦中的概念尋求「設備」往往仍在隆隆運轉,試圖將無意義的理論強加于原本隨機的數據。心理學家曾對此現象進行了實驗研究。一個實驗情境中,要求被試觀察一系列在多個維度上有所區別的刺|激物,並告訴他們其中的一些刺|激物屬於一類,而其他的則屬於另一類,被試的任務是去判斷每一個刺|激物屬於這兩類中的哪一類。實際上,刺|激物是研究者隨機歸類的,因此除了隨機性,並沒有任何其他規律。但是,被試很少敢做隨機猜測。相反地,他們通常會絞盡腦汁,虛構一個複雜的分類方法,並對他們給這些刺|激物所做的分類做出解釋。
某些心理學家聲稱,他們能對個體進行預測,從而超越了對「一般人」或不同類別的人所進行的預測……某些心理學家最大的不同在於,他們主張將每個人理解為獨一無二的個體而不是群體的一部分,而統計概括是適用於群體的。某些心理學家聲稱能分析出在個體的生活中「什麼導致了什麼」,而不說「總體而言」什麼是對的。(Dawes, 1994, pp.79-80)
5.兩人都由叫約翰遜的南方人繼任。
若干年前,安·蘭德炮製了一系列流傳甚廣的有關亞伯拉罕·林肯總統和約翰·肯尼迪總統之間令人「毛骨悚然」的巧合:
10.刺殺他們的兇手,查爾斯·基埃圖和利昂·喬爾戈什聽起來都不像美國人的名字。
一個職業心理學家在法庭上宣稱,他有一種效果極佳的「臨床判斷」,是基於他自己多年所積累的經驗,無法公開證實,只能在諸如專業資歷、做出相同證言的年數、態度品行等無關聯的方面接受挑戰。與之相反,一個統計模型可以在理性方面接受挑戰,因為它是公眾性的(p.104)。
6.兩人都被有三個名字的人暗殺(John Wilkes Booth和Lee Harvey Oswald)。
從我們和賭徒的討論中可以非常清楚地看出,賭徒大體上都能意識到賭博造成的不良後果。他們也知道最終輸的會比贏的多,而且在未來也是如此。但他們卻不能把這些統計性的思路應用到下一局、下一小時或下一個晚上。豐富的直覺經驗還是讓他們覺得,統計學在下一局或下一小時里派不上用場,他們相信自己能夠預測下一局的結果(p.117)。
6.麥金利和加菲爾德都被來自紐約市的副總統取代:西奧多·羅斯福和切斯特·亞倫·阿瑟。
5.麥金利和加菲爾德這兩個名字都有8個字母。
許多有控制的研究(如King & Koehler, 2000;Stanovich & West, 1998)都證明,當人們頭腦中已經預設了兩個變數相互關聯的想法時,他們甚至能夠在兩個變數根本毫無關係的數據中發現聯繫。不幸的是,這一發現在現實生活中也廣泛存在,並對人們的生活產生負面影響。例如,許多從事心理治療工作的人一直都對羅夏墨跡測驗的效度深信不疑。這個著名的墨跡測驗要求被試對一張白紙上的墨跡做出反應。因為這一墨跡缺乏結構,所以其理論是,人們會以自己對模糊情境的典型反應來對這些墨跡做出反應,從而揭示其「潛藏的」心理特質。這種測驗也被稱為投射測驗,因為它假定被試會將他們潛意識的內心活動和感受投射在墨跡上。然而問題是,沒有任何證據表明當羅夏測驗作為一個投射測驗而使用時,提供了任何額外的診斷價值(Garb, Florio, & Grove, 1998; Lilienfeld, 1999; Lilienfeld et al., 2000; Wood, Nezworski, & Stejskal, 1996; Wood, Nezworski, Lilienfeld, & Garb, 2003)。對羅夏測驗的信心是源自於錯覺相關這一現象。臨床心理醫生從病人的反應模式中看到了聯繫,是因為他們相信本來就有這種聯繫,而不是真的從反應模式中觀察到了什麼聯繫。
心理學家雷·海曼(RayHyman)討論了人們喜歡在原本沒有模式地方的尋找模式的傾向:

接受錯誤以減少錯誤:臨床預測與統計預測

在心理學的許多分支領域,如認知心理學、發展心理學、組織心理學、人格心理學與社會心理學中,其知識都是通過統計預測來表述的。相反,一些臨床心理從業者則聲稱他們可以超越群體預測,對特定個體做出百分之百準確的預測,這種預測被稱為臨床預測或個案預測。與統計預測相反,臨床預測是這樣的:
當公平世界假設這一信念被推向極致時,會催生出一些非常有害或是不人道的教條。且看20世紀80年代早期美國教育部一名官員的邏輯,他說,殘疾人「錯誤地認為生命中的巧合令他們偶然受到懲罰,實際並非如此。所有發生在某個人成長過程中的某個點上的事,沒有一件不是由他本人所招致的……這句話聽上去好像很不公平,但是一個人所處的外部環境確實是與他內在心靈的發展相一致的」(Gilovich, 1991, p.l43)。正如吉洛維奇所指出的,「這真不該是一個想進入教育部高層的官員所持有的哲學,教育部本應是負責給予殘疾人士同等教育機會的機構」(pp.143-144)——但如果我們拒絕將這類後果歸為偶然性,結果必然會導致這種不人道的哲學。
華格納發現,強迫性賭徒對「接受錯誤以減少錯誤」有很強的排斥傾向https://read.99csw.com。例如,二十一點牌局的玩家,普遍拒絕使用一種基本策略(見Wagenaar, 1998, 第2章),這種基本策略可以保證把莊家的勝率從6%或8%降低到不足1%。基本策略是一個長期性的統計策略,強迫性賭徒之所以拒絕它,是因為他們堅信「有效的策略應該是在每一把都有效」(p.110)。華格納研究中的賭徒「總一成不變地說,這類系統的一般性策略是不會有用的,因為它們忽略了每一個具體情境的獨特性」(p.110)。這些賭徒拋棄能保證他們少輸上千美元的統計策略不用,轉而去徒勞地追求建立在每一具體情境獨特性基礎之上的「臨床預測」。
4.麥金利和加菲爾德為了保護美國工業,都支持金本位制和關稅保護制。
但是,「接受錯誤以減少錯誤」做起來很難。在心理學領域里,40年來關於臨床預測和統計預測的研究就證明了這一點。統計預測是指依據統計資料中得出的群體趨勢所作的預測。本章一開始所討論的群體(也就是總體)預測就是屬於這種預測。一種簡單的統計預測是,針對凡是具有某種特徵的所有個體,做出相同的預測。例如,預測不吸煙者的壽命是77.5歲,而吸煙的人是64.3歲,就是一個統計預測。如果考慮的群體特徵不只一個(運用第5章談到的複雜相關技術——尤其是多元回歸技術)將令我們的預測更加準確。例如,預測吸煙、肥胖且不運動者的壽命是58.2歲,就是在一個多變數(吸煙行為、體重和運動量)基礎上的統計預測,這樣的預測總是比單變數的預測更加準確。統計預測在經濟學、人力資源、犯罪學、商業與市場學以及醫學等領域都很常見。
心理學家、統計學家以及其他科學家都指出,許多罕見匹配實際上並沒有人們通常認為的那麼「罕見」。著名的「生日問題」是最好的例子。在一個23人的班級里,有兩個人生日是同一天的概率是多少?大多數人會認為非常低。而實際上,23人的班級中,兩人同一天過生曰的可能性大於50%。而在35人的班級,可能性就更大了(概率大於0.80,見Martin, 1998)。所以,因為美國歷史上有43位總統,因此詹姆斯·波爾克和沃倫·哈丁兩位在同一天出生(11月2日)也就不足為奇了。同樣地,有38位總統都已過世,其中米勒德·菲爾莫爾和威廉·塔夫脫死於同一天(3月8日)也不應令人感到驚訝,甚至還有另外3位總統——約翰·亞當斯、托馬斯·傑菲遜、詹姆斯·門羅——都死於同一天,而這一天竟然是7月4日,美國獨立日!後面這個神奇嗎?其實不過是概率使然罷了。
這個關於財經預測的例子的延伸,證明了原本純粹隨機的事件會因怎樣的邏輯而看起來像是由可以預測的因素造成的(Fridson, 1993; Paolos, 1988)。假想你收到一封信,信中告訴你有這樣一份關於股票市場預測的通訊。這個通訊並不收費,只是要求你試試照著他們的建議去買股票,然後看看它的預測靈不靈。它告訴你IBM的股票會在下個月攀升。你把這份通訊隨手一扔,但是你確實注意到在下一個月里IBM股票果真漲了。如果你曾讀過一本與本書的內容類似的書,你會覺得這是稀鬆平常的事情,僅會將其視為一次僥倖的猜中。後來你又收到另一份來自同一家投資諮詢公司的通訊,該通訊說IBM股票會在下個月下跌,當股票確實跌了的時候,你仍將其視為僥倖,但是這一次你可能就有點兒好奇了。當這家公司寄來第三份通訊,預測IBM下個月會再次下跌時,你發現自己對這幾頁財經內容的關注度提高了。繼而你發現該通訊又一次做出了準確預測,IBM這個月確實又下跌了。當來自這家公司的第四份通訊說IBM下月會漲,而且也確實漲了時,你難免會覺得這個通訊真還挺神,而情不自禁地想花29.95美元去訂一年這本如此有價值的通訊。這種誘惑難以抵擋,除非你能想象:此時在一個簡陋的地下室里,某人正在準備下周要寄出的1600份通訊,這些通訊會按電話黃頁上的1600個地址發出,其中800份預測IBM下月上漲,800份預測下跌。當IBM在下個月真的漲了,公司就繼續把通訊只發給上月接收到正確預測的800位「客戶」(當然,其中還是400份預測漲,另外400份預測跌)。然後,你可以想象,這個「鍋爐房」——可能還包括在背後煽風點火、輔助造勢的電話營銷騙子——正在向第二周接收到正確預測的400位客戶發送第三個月的預測通訊(還是200份預測漲,200份預測跌)。是的,你就是連續四次收到正確的隨機預測信息的100個幸運兒之一!這100個「幸運兒」中的大多數會為了能繼續收到通訊而支付29.95美元。
同樣地,形形色|色的「預謀論」通常也需要一套又一套複雜的說辭去解釋那些預謀論者拚命想要理解的、原本是由隨機因素導致的事件。這一現象十分典型,甚至各類權威人士在其專業領域內的工作也往往如是。許多金融分析師的思維方式就體現了這一謬誤。他們通常會對股票市場價格的每一次小的波動都編造出精細的解釋,而實際上這種變化大多只是隨機波動而已(Malldel, 2004; Taleb, 2001)。然而,股票市場分析師總是不斷對客戶暗示他們可以(也許他們也相信自己可以)「征服市場」,即使當大量的證據表明他們中的大部分其實是做不到這一點的。過去幾十年中,如果你購買了標準普爾指數中的所有500種股票,然後放著不去管它(我們稱之為「傻子策略」的辦法——去買一種依照這一指數的互惠基金),那麼今天你獲得的回報會比2/3的華爾街股票經紀人為他們的顧客所賺的還要高(Egan, 2005; Hulbert, 2006; Malkiel, 2004; Updegrave, 1995),你的成績也會打敗80%訂閱費已經漲至每年500美元的財經通訊雜誌(Kim, 1994)。
7.Booth和Oswald都持有不受人歡迎的政見。
7.羅斯福和阿瑟兩人的名字都有17個字母。
1.林肯於1860年當選總統;肯尼迪則於1960年當選。
2.林肯和肯尼迪都關注民權。
華格納和科瑞(Wagenaar & Keren, 1986)論證了對個人知識的過分自信以及對統計信息的忽視,會破壞「系安全帶駕車」的交通安全推廣活動的效果。因為人們總是認為:「我和別人不一樣,我駕車很安全」。問題是85%的人都認為「自己的技術比一般駕車者高明」(Svenson, 1981)——這顯然是很荒謬的。
實際上,如果我們將「接受錯誤以減少錯誤」變為一種習慣,心理學和整個社會都將從中受益。在試圖對每一個不同尋常的事件做出獨特解釋時(就我們目前的知識情況來說,獨特的解釋也許根本不可能),我們常常喪失了對更多平常事件的預測能力。請大家再次回想一下紅燈-藍燈實驗,誠然,「百分百紅燈策略」會對出現概率較小或很少出現的不尋常事件(藍燈亮)做出錯誤的預測,但如果我們把注意力放在出現概率較小的事件上,採用「70%紅燈、30%藍燈https://read.99csw.com策略」,結果會怎樣呢?我們會在30個不尋常事件中正確預測9次(30x0.3), 其代價是喪失了對21個常見事件做出正確預測的機會,沒有對紅燈做出70次的正確預測,只獲得49次的正確預測(70x0.70)。臨床領域中的行為預測也遵循相同的邏輯,為每一個案編造複雜的解釋,確實可能抓住一小部分不尋常事件——旦這是以損失了對大多數事件的正確預測為代價的,而在此方面,簡單的統計預測則更有效。加望德(Gawande, 1998)指出,醫學領域也同樣需要學習「接受錯誤以減少錯誤」這個道理。他認為在醫學里,強調直覺、個別化的治療方法「是有缺陷的——我們試圖承認並考慮人類複雜性的因素,但這非但沒有避免錯誤,反倒招致了更多的錯誤」(p.80)。
偶然性在心理學中扮演的角色時常被外行人士和臨床心理從業者所誤解。人們很難認識到,行為事件結果的變化中有一部分是由偶然因素造成的。也就是說,行為的變化有一部分是隨機因素作用的結果,因此心理學家不應自詡能夠預測每一例個案的行為。心理學的預測應該是概率性的——是對總體趨勢的概率性預測。
3.麥金利和加菲爾德都在眾議院任過職。
《韋氏新世界字典》(Webster's World Dictionary)里把巧合定義為:「相互關聯或相同的事件意外地、令人不可思議地同時出現了。」鑒於這本字典把意外定義為「偶然地出現」,所以這個定義不存在問題。巧合只是相關事件偶然地同時出現。不幸的是,許多人並不這樣解釋巧合。那些在事件中尋求模式和意義的傾向與巧合「不可思議的」的特性結合在一起,讓許多人忘記他們可以用偶然這一因素來解釋巧合,反而為理解這一現象尋求特別的解釋。下面講的這個故事你一定已經聽過無數次了:「那天我正坐在那兒尋思,我好久沒給德克薩斯州的老比爾叔叔打電話了,緊接著電話鈴就響了,你猜怎麼著!正是我那老比爾叔叔打來的。這種心靈感應的背後肯定有點兒什麼原因!」這就是一個典型的為巧合事件編造解釋的例子。每天,我們大多數人都可能想到很多或遠或近的人,這些人在我們想起他們時,有多少人可能會打電話來呢?幾乎沒有可能。這樣一年之內,我們可能想過數百個不曾打來電話的人。最終,在經曆數百次這種我們不曾意識到的「錯誤嘗試」之後,某個人在我們想他/她的時候正準備給我們打電話。這種事情難得一見,但難得一見的事情也會發生——純粹是偶然。其他解釋都是畫蛇添足。
在我們的生活中,許多人際交往裡都包含大量的偶然成分:「互不相識的男女約會最終促成了婚姻;取消約談而丟了工作;誤了班車而遇到了高中的老同學,等等。認為生活中每一件偶然的小事都需要精細的解釋,這種想法是錯誤的。但是,當偶然事件確實會產生重要的後果時,人們不免要建構一些複雜的理論去解釋它們。

解釋偶然性:錯覺相關和控制錯覺

我們不得不運用自己原有的知識和期望以獲得對世界萬物的理解。在大多數的一般情境中,這種對於知識背景和記憶的運用讓我們正確地闡釋一些主張,並對此提供必要的推論。但這一強有力的機制在原本沒有承載任何信息的情境中偏離正軌。有些本是能夠輕而易舉就識別出來的隨機性噪音,我們卻不懈地要從中尋找意義(Hyman, 1981, p.96)。
在多個臨床領域中,研究者給臨床心理醫生一份病人的信息,讓其預測這個病人的行為。與此同時,他們也把同樣的信息加以量化,用一個統計方程加以分析,這一方程是以先前研究發現的統計關係為基礎編製的。結果都是統計方程大獲全勝。這就表明,統計預測比臨床預測更為準確。事實上,即使是在臨床心理醫生可以獲得比統計方法更多的資料的情況下,後者仍然比前者的預測更準確。也就是說,臨床心理醫生除了擁有與統計預測一樣的量化資料以外,還擁有與病人單獨接觸和訪談所得到的資料,但是這並沒有令其預測變得像統計預測那樣準確。「即使擁有信息優勢,臨床判斷仍然不能超越統計方法;實際上,擁有更多的信息,並不能彌補兩種方法之間的差距」(Dawes et al., 1989, p.1670)。產生這種結果的原因當然是統計方程將各種信息數據按照優化標準整合起來,並且做得準確而穩定。優化和穩定這兩個因素就讓臨床心理醫生通過非正式方法收集到的資料和信息的優勢消失殆盡。
臨床預測似乎可以視為是對統計預測的有用補充,但問題是,臨床預測並不准確。
「統計數據不適用於單一個案」這一同樣的謬誤,是導致賭徒積習難改的重要因素。華格納(1988)在他的賭博行為研究中總結道:
我們大腦的進化始終以這樣一種方式,就是讓我們能夠不懈地尋求世界中的各種模式。我們尋求身邊事物的關係、解釋及其背後的意義。心理學家已經對這種強烈傾向進行了研究。這是人類智力的典型特徵,而且能夠解釋人類在信息加工和知識獲得過程中表現出來的令人驚嘆的諸多能力。
在諸如心理治療效果等問題上,承認統計預測優於臨床預測並不會對心理學的聲望造成任何損失,因為在醫學、商學、犯罪學、會計學甚至是家畜鑒定等許多領域中,這條規律都適用(見Dawes, 1994; Dawes et al., 1989; Dowie & Elstein, 1988)。儘管從總體上說,心理學不會因為這些研究結果而有什麼損失,但是對那些以「專家」身份出入各種活動,並讓病人相信他們有獨一無二的臨床個案知識的臨床心理從業者來說,當然會造成聲譽或者收入上的損失。然而,正如麥佛和瑞特(Mc Fall & Treat,1999)在一篇論述臨床評估價值的文章所提醒的那樣:「我們試圖評估和預測的事情在本質上是概率性的。這意味著我們不能期望大自然會如此聽話,能讓我們以百分百的把握去預測單一事件。相反,我們最高的期望也只能是鑒別一系列可能的結果,然後去估計每個結果出現的相對可能性。從這種概率的角度看,傳統臨床評估期望達到的那種理想化目標——對獨特的未來事件做出精確的預測——其實太天真了,反映了我們的無知或自大,或二者兼有」(p.217)。
許多關於總統之間聯繫的清單都很相似。總之,考慮到一個人幾十年的生命中人際交往和各類事件的複雜性,在這樣一個包含成千上萬個事件的樣本空間里,任何兩個人之間如果找不到什麼相似之處才是讓人感到奇怪的(Martin, 1998)。
對於研究顯示統計預測優於臨床預測的優勢,米爾(Meehl, 1986)曾說:「社會科學中,沒有任何一個爭議能如這次這般,從這麼大量的、性質上如此多樣的研究中得到如此一致的結論。」(pp.373-374)。但令人尷尬的是,心理學領域並沒有應用這一知識。例如,這個學科在研究生入學與心理健康培訓招生等程序中仍然不停地使用個人面試,儘管大量征據表明,面試方法缺乏效度。臨床工作者也繼續利用一些似是而非的證據來證明他們對於「九九藏書臨床直覺」的依賴是合理的,而不依靠更有效的總體性預測。例如,道斯等(Dawesetal, 1989)曾指出:

巧合

2.麥金利和加菲爾德都是美國內戰的老兵。
還有一些心理學家則研究了另一個與此相關的現象,該現象被稱為公平世界假設,它是指人們傾向於相信自己是生活在一個公平的世界里,在這裏每個人都得到他們應得的東西(Hkfer & Begue, 2005)。研究者發現了一些實驗證據,證明了公平世界中存在一種「罪有應得」的信念:人們會鄙視那些偶然不幸的受害者。為偶然事件尋求解釋的傾嚮導致了這一現象。人們很難相信一個完美無瑕的或是道德修養高的人會因為偶然事件而慘遭不幸。固然我們想要相信好人有好報、惡人有惡報,但是,偶然性是不偏不倚的,它以完全不同的方式運行:好事壞事都以相同的概率發生在不同人身上。
一種普遍的反統計論調或誤區在於,認為群體統計不適用單個人或事。這種觀點是對概率基本原則的誤用……要保持邏輯上的一致,反統計論的鼓吹者就必須相信並承認,如果一個人被迫玩一次俄羅斯輪盤賭,允許他選擇膛內裝有1發或5發子彈。事件的單一性使得選哪把槍都無所謂(p.1672)。
如果人們真正理解了巧合的含義(一個偶然發生的令人不可思議的事件),他們就不會落入陷阱去尋求系統的、非偶然性的解釋。但事實正相反,對很多人來說,巧合是需要偶然性以外的原因來解釋的。例如,許多人都聽到過這樣的說法:「天哪!簡直太巧了!我真想知道為什麼!」為此,馬科斯(Marks,2001)建議大家今後用罕見匹配這個比較中性的名詞來形容令我們感到驚異的兩個事件的同時出現。
8.兩個副總統都蓄鬚。
想想如果我們現在對你個人生活中的罕見匹配加以分析,會得到什麼結果。假定某一天里你參与了100件不同的事情。考慮到現代工業社會中生活的複雜性,這個數字並沒有高估,實際上可能還低估了。你看電視、打電話、與人面談、討論去工作或去商場的路線、做煩人的家務、看書獲取信息、在上班時完成複雜的任務等等。所有這些事件都包含很多可單獨記憶的成分。這樣一算,100件事其實真不算多,不過,我們就按100件事情來算。罕見匹配是指其中兩個事件不可思議地聯繫在一起了。那麼典型的一天中這100件事之間共有多少不同的、兩兩匹配的組合呢?用一個簡單的公式就能算出結果,你通常一天有4950個不同的配對組合,而一年有365天。我們知道,罕見匹配是令人難忘的,比爾叔叔打來電話的那一天可能令你數年難忘。假如你把10年內所記得的所有罕見匹配數出來,也許也就6或7件(或多或少,人們對於小概率有不同的標準)。這6、7件事情來自於一個多大的概率事件樣本庫呢?每天4950個配對事件,乘以一年365天,再乘以10年,得到18067500個配對。總之,10年中如果有6個你認為是罕見匹配的聯繫發生了,就有18067494個也可能是罕見匹配的其他配對事件發生了。所以,你的生活中的一個罕見匹配發生的概率是0.00000033。有6個罕見匹配出現在1800萬個事件中,的確很稀罕,但並不奇怪。罕見的事件確實發生了,它們也的確少見,但是,偶然性這一因素保證了它們一定會發生(回憶前面擲5枚硬幣的例子)。在我們的例子中,6件奇事發生在你身上,它們可能是巧合:兩個相關事件由於偶然性的存在而不可思議地同時發生了。
然而,人類認知過程的這種極具生存適應性有時也會反戈一擊。例如,環境中沒有什麼可以進行概念化的東西,可我們還是還一味地去尋求概念性的理解,這就是一種不良適應。那麼,到底是什麼在人類認知這一最與眾不同的方面製造麻煩呢?是什麼打亂了我們對結構的尋求並阻礙了我們對事物的理解呢?你猜對了,是概率。說得更具體些,是偶然性和隨機性。
人們有解釋偶然事件的傾向,這一現象在心理學的研究中稱為錯覺相關。當人們相信兩類事件在通常情況下應該一起發生時,就會認為自己頻繁地看到了同時發生的現象,甚至當這兩類事件的同時出現是隨機的,並不比任何其他兩個事件同時發生的頻率更高時也是如此。總之,即使是面對隨機事件,人們也傾向於看到他們所期望的聯繫(Nisbett & Ross, 1980; Stanovich, 1999, 2004)。他們在原本沒有規律的地方看到了規律。
在試圖解釋世界上發生的所有事,同時又拒絕承認偶然因素的作用,實際上會降低我們對現實世界的預測能力。在某個領域中,承認偶然因素的作用意味著研究者必須接受這樣一個事實,即我們的預測不可能百分之百準確,預測中總是會犯一些錯誤。但有趣的是,承認我們的預測達不到百分之百的準確度,實際上反而有助於我們提高整體預測的精確性。這聽起來好像有點兒矛盾,但是事實確是如此:為了減少錯誤就必須接受錯誤(Dawes, 1991; Einhorn, 1986)。
偶然性和隨機性是我們周圍環境不可分割的一部分。偶然性和隨機性的規律支配著生物進化和基因重組的機制,物理學也運用關於偶然性的統計定律來解釋物質的基本結構。自然界發生的很多事情,都是系統性以及可解釋的因素與偶然因素共同作用的結果。再回想一下前面談到的例子:吸煙導致肺癌。生物學上系統的、可解釋的方面將吸煙和某一疾病聯繫起來,但這並不表示所有吸煙者都會患肺癌,這種趨勢是概率性的。或許最終我們能解釋為什麼有些吸煙者不會患肺癌,但在現階段,這種變異性必須歸因於大量偶然性因素,是這些因素決定一個人是否患某一疾病。
「我們必須接受錯誤以減少錯誤」這一概念可以通過一個在認知心理學實驗室里研究了數十年的非常簡單的實驗任務來證明(Fantino & Esfandiari, 2002; Gal & Baron, 1996)。這個實驗任務是這樣的,被試坐在兩盞燈(一紅一藍)前,實驗者要求他們去預測每次測試時哪一盞燈會亮,被試要參与很多輪這樣的測試,並按準確率給予一定的報酬。實際上,所有的測試都是在70%的次數亮紅燈、30%的次數亮藍燈的條件下進行的,兩種燈以隨機順序出現。實驗過程中,被試很快就感到紅燈亮的次數比較多,因此也就在更多的測試中預測紅燈會亮。事實上,他們確實在大約70%的測試中預測紅燈會亮。然而,正如前面所討論的,被試在實驗過程中逐漸發現並相信燈亮是有一定模式的,但卻從沒想過序列是隨機的。為了要使他們的預測百發百中,他們在紅燈與藍燈之間換來換去,保持70%的次數預測紅燈會亮,30%預測藍燈會亮。被試極少意識到,如果他們放棄對「百發百中」的追求,他們的預測會更好一些!為什麼會是這樣的呢?
發生在我們個人生活中的罕見匹配往往對我們具有特殊的意義,我們尤其不願將其歸因為偶然。產生這種傾向的原因有很多,某些是動機性和情感性的,還有一些是概率推理的失敗。我們通常不能意識到,罕見匹配只是巨大「九九藏書概率事件」樣本庫中一個非常小的部分而已。對我們中的某些人來說,罕見匹配看起來好像經常發生,但是它真的經常發生嗎?
公平世界假設中所體現的對於偶然性的錯誤理解,也助長了其他一些錯誤的民間信念,導致人們容易看到虛假相關。例如,我們在第6章中提到過,「盲人有非常敏銳的聽覺」就是一個錯誤的信念,這個錯誤信念可能會一直流傳下去,因為這種聯繫能體現「老天很公平」,而這正是人們希望看到的。
然而,百分百紅燈策略取得的高準確率是要付出代價的:必須放棄「百發百中」的願望。(顯然,藍燈偶爾亮的時候,被試始終是在預測紅燈亮,也就是放棄了在藍燈亮的測試中命中的機會)。這就是接受錯誤以減少錯誤。放棄不犯錯誤的想法,會讓被試獲得更高的總體準確度。同理,以一定的精度預測人類的行為時,有時也需要接受錯誤以減少錯誤,也就是,在依靠一般性的原則來做出比較準確的預測的同時,也要承認我們不可能在每件具體事情上都對。

個人的巧合

8.Booth在劇院里射殺了林肯,然後藏在倉庫里;Oswald從倉庫中射殺了肯尼迪,然後藏在劇院里。
試圖去解釋偶然事件的傾向可能源於我們深切地渴望相信自己是可以控制這些事件的。心理學家埃倫·蘭格(EllenLanger)研究了控制錯覺這一現象,指的是人們有一種傾向,願意相信個人能力可以影響偶然事件的結果。在一項研究中,兩個不同公司的僱員向同事兜售彩票,一些人只是簡單地塞到手裡,而另一些人則可以自行抽取。當然,在隨機抽獎的事件中,彩票是自行抽取的還是派發的沒有什麼區別,中獎率都是一樣的。但是,第二天,當這兩個僱員試圖向這些同事買回彩票時,自行抽取彩票的被試對彩票的要價是被派發者的四倍!在另外幾項實驗研究中,蘭格證實了這一假設,之所以出現這些結果,是因為人們不能接受個人因素無法影響偶然事件這一事實。這一錯覺廣泛存在的證據來自於美國各州發行彩票的經驗。這些州充斥著教人們如何「征服」彩票的偽科學書籍。這類書之所以暢銷,是因為人們不懂得隨機性的含義。事實上,自從20世紀70年代中期新澤西州發明了一種新的彩票售賣方式之後,美國各州才爆發購買彩票的熱潮。這種方式就是讓購買者可以自行刮獎或自行挑選號碼(Clotfelter & Cook, 1989; Thaler, 1992,p.138)。用這種售賣方式來進行的抽獎活動通常叫做「參与性抽彩」,而這類參与性抽彩正是利用了當時蘭格研究的控制錯覺現象:人們錯誤地相信他們的參与行為能夠決定隨機事件。
4.林肯有一個秘書叫肯尼迪,肯尼迪也有一個秘書叫林肯。
在上一章里我們討論了概率趨勢、概率思維和統計推理的重要性。本章將沿襲這一話題,重點強調人們理解隨機性和偶然性這兩個概念時遇到的問題。我們將強調,由於沒有領會偶然性是如何始終貫穿於心理學理論中的,人們常常誤解了研究對於臨床實踐的貢獻。
對於想要運用心理學知識的外行人來說,理解偶然性這一因素的作用是非常重要的。受過正規訓練的心理學家承認他們的理論只能解釋人類行為變化的一部分而非全部,他們會坦然面對偶然因素。但是,那個在奧普拉秀中出現的(見第4章開頭)能對每一個個案及人類行為的每個細節做出解釋的嘉賓,引發的不是崇拜而是質疑。真正的科學家不懼怕承認自己的無知。總之,評價心理學主張的另一實用法則就是:在接受對某個事件的複雜解釋之前,先想一想偶然因素在其中扮演了什麼角色。
檢驗臨床-統計預測的研究文獻中,還包含這麼一種方法,那就是給臨床心理醫生由統計方程得來的預測結果,讓其根據自己與病人接觸的經驗來對這一預測做出調整。結果,臨床醫生對統計預測做出調整后,預測的準確度非但沒有增加,反而降低了(見Dawes,1994)。在這裏我們又看到了一個不能「接受錯誤以減少錯誤」的絕好例子,與前面所述的那個紅藍燈預測實驗非常類似。應當利用燈亮次數多少這一統計信息而採用每次都預測紅燈的策略(可以獲得70%的正確率)時,被試卻為追求次次正確而在紅燈與藍燈之間換來換去,結果正確率反而降低了12%(只有58%的次數是正確的)。同樣地,在上述研究中,臨床心理醫生相信,他們的經驗應該可以提供給自己一些「洞察力」,從而得以做出比定量數據更好的預測。實際上,這些「洞察力」根本不存在,他們的預測比依賴公開的統計信息所做出的預測要差。最後需要指出的是,統計預測的優越性並不局限於心理學,它業已擴展到了許多其他臨床科學中——例如,醫學中對心電圖的解讀(Gawande,1998)。
9.麥金利和加菲爾德都在任期內第一年的9月被槍殺。
關於這一點的一個類比是,問你自己對如下科學發現的反應是什麼,這個發現是:完成過多次類似手術的醫生,在下一例手術中成功的概率會比較高(Christensen, 1999)。現在有一個醫生A,他常做某一類手術,失敗的可能性很小,而另一個醫生B從沒做過這種手術,失敗率可能很高,請問,你願意讓這兩個醫生中的哪一個來為你做手術呢?如果你相信「概率不適用於個案」,那你就不該介意讓醫生B給你做手術。
這個例子說明,當一件事取決於偶然性時,並不一定表示它是不確定的,只是說它目前是無法確定的。擲硬幣是偶然事件,但並不是說在對拋擲的角度、硬幣內的金屬成分以及許多其他變數加以測量之後,也不可能確定其拋擲的結果。實際上,這些變數確實決定了擲硬幣的結果。但是,我們稱擲硬幣為隨機事件,是因為在每一次拋擲時,我們沒有比較簡易快捷的方法來測量這些變數。一次拋擲的結果並不是嚴格意義上的不確定,它只是在當下無法確定而已。
表示自己可以在個體層次上進行心理預測,是臨床心理學家常犯的錯誤。他們有時候會錯誤地暗示別人,臨床訓練賦予了他們一種對個別案例做出準確預測的「直覺」能力。恰恰相反,幾十年來,有價值的研究都一致表明:在解釋人類行為的原因方面,統計預測(基於群體統計趨勢的預測)遠遠優於臨床預測。目前還沒有證據表明,臨床直覺能預測一個統計趨勢是否會在一個特定的個案身上出現。因此,當對行為進行預測時,千萬不要對統計資料置之不理。統計預測也昭示,當對人類的行為進行預測時,錯誤和不確定性將始終存在。
當然,這裡有關臨床-統計預測研究文獻的討論,並不意味著個案研究在心理學中毫無價值。請大家記住,這一章所談的只是「對行為的預測」這一特定情境。回想一下在第4章中對於個案研究價值的討論,個案信息在引發對重要的、需要進一步研究的變數的關注方面是非常有用的。而這一章中所說的則是,一旦相關的變數已經確定,我們要開始運用它們來預測行為時,測量這些變數並使用統計公式來進行預測始終是最優程序。首先,我們通過統計方法得到了更為準確的預測;其次,統計方式優於臨床預測之處在於,統計程序所得出的預測是公共知識,任何人都可以使用、修改、批評或爭論。相反,如果使用臨床預測就等於要依靠個別read.99csw.com權威的評估——由於這類判斷太過個別和特殊——因此不能接受公眾的評議。正如道斯(Dawes, 1994)所述:
但是,我們要如何看待那些確實打敗了傻子策略的經紀人呢?你可能想知道這是否意味著他們具有某些特殊的才能。我們通過設想這樣一個實驗來回答這個問題:有100隻猴子,每隻猴子手中握有10支飛鏢,它們都向一面寫有標準普爾500指數的牆上擲飛鏢,飛鏢扎中的股票就是那年要買的股票。那麼,一年後它們的業績會是怎麼樣的呢?有多少只猴子能打敗標準普爾500指數?恭喜你答對了。大概有一半的猴子會。那麼,你會不會願意付錢給這一半打敗標準普爾500指數的猴子,授權它們在下一年幫你選股呢?
懂得在什麼時候避免對純粹隨機因素導致的事件編造複雜的解釋,這是具有實際作用的。作家艾圖爾·嘉萬迪曾描述了1973年贖罪日戰爭期間,認知心理學家卡尼曼和以色列空軍打交道的事例。兩個飛行中隊出發並返航,一隊損失了四架飛機,另一隊則沒有損失。軍方希望卡尼曼調查一下,之所以有這樣的差異,是否有特別的因素在起作用。卡尼曼並沒有去做調查,他僅僅運用了本章所談到的理念去告訴以色列空軍不要浪費時間:「卡尼曼知道,如果空軍官員真的去調查,他們將不可避免地在兩個中隊間發現一些可測量的差異,並且感覺非得做點什麼」(Gawande, 1999, p.37)。但是卡尼曼知道,任何找到的因素都極有可能是虛假的——不過是純粹的偶然性波動的結果而已。
現在看來這就像是一個玩弄眾人于股掌之上的可怕騙局。實際也是如此。而當那些「受人尊敬」的財經雜誌或電視節目給你推薦「連續四年擊敗一半以上對手的股票經紀人」時,情況也好不到哪兒去。請回想一下猴子擲飛鏢的場景,設想這些猴子是年年選股的股票經紀人。很明顯,第一年他們之中有50%會擊敗他們的對手。第二年,這50%的人中又有一半——按隨機水平來說——會擊敗其對手,即25%的經紀人能連續兩年擊敗他們的對手。之後第三年又有一半——隨機水平——能擊敗對手,即總人數的12.5%連續三年擊敗對手。最終到第四年,又會有這些人的一半(總人數的6.25%)能擊敗自己的對手。因此,100隻猴子中大概有6隻能取得像財經節目和報紙所說的「連續四年擊敗了其他的經紀人」的驕人成績。那麼,這6隻擊敗了一起扔飛鏢的同伴的猴子(正如你所見,也擊敗了大多數現實生活中的華爾街經紀人;參見Egan, 2005; Malkiel, 2004)的確有資格在電視節目「華爾街一周」中亮相,你覺得呢?
當然,作為巧合,這些事之間的聯繫一點也不令人毛骨悚然。德克薩斯大學的電腦程序師約翰·李維(John Leavy, 1992)曾經搞了一個「令人脊背發涼的總統巧合競賽」來說明,實際上在任何兩個總統之間找到像上述那樣的一個清單是多麼容易的事(見Dudley, 1998)。例如,李維的文章中比較了威廉·亨利·哈里森和扎卡里·泰勒、波爾克和卡特、加菲爾德和麥金利、林肯和傑克遜、尼克鬆和傑斐遜、華盛頓和艾森豪威爾威爾、格蘭特和尼克鬆、麥迪遜和威爾遜之間的相似之處。下面是加菲爾德和麥金利之間驚人的相似之處:
有一種錯誤信念助長了為巧合事件尋求解釋的傾向,這種信念認為罕見的事不會發生,罕見匹配也絕非偶然。我們的這類錯誤信念之所以如此強烈,是因為概率有時是用幾率(odds)這一詞語來表述的,而這種表述具有雙關的暗示作用。看看我們是用什麼方式來表述概率的:「啊!天哪,這事兒是極不可能發生的!因為它出現的幾率只有1/100!」我們在做這樣的表述時所用的方式讓人強烈地感覺到這件事絕不會發生。當然,我們可以用另外一種表達方式來表述同一件事,而這一方式可能給人帶來完全不同的感受:「在100個同類事件中,這種結果可能會出現一次。」這種表述方式強調,儘管這一事件是少見的,但是長時間來看,罕見的事終究一定會發生的。簡言之,罕見匹配是會偶然發生的。
為純粹偶然的事件尋求解釋的這種傾向,也導致我們對許多巧合事件的性質產生誤解。許多人認為巧合需要特別的解釋,他們不理解巧合的發生並不需要偶然性之外的因素,巧合併不需要特別的解釋。
3.林肯和肯尼迪這兩個名字都有7個字母。
如果證明臨床預測是有效的,那麼一個臨床醫生與他的病人接觸的經驗以及有效運用病人所提供的信息,應該使他能夠提出比較好的預測,這個預測一定能勝過對病人信息進行編碼、然後輸入能夠對量化數據加工的統計程序而得到的預測結果。總之,有人主張說,臨床心理從業者的經驗使得他們能夠超越尚未由研究揭示的關係。「臨床預測是有效的」這一觀點很容易驗證,不幸的是,經過檢驗,這一觀點被證明是錯誤的。
1.麥金利和加菲爾德都生長在俄亥俄州。
讓我們想想這一情境背後的邏輯。在以70:30的比例隨機點亮紅燈或藍燈的情況下,如果被試在70%的測試中預測紅燈會亮,30%的測試中預測藍燈會亮,他的準確率會是多少呢?我們將用實驗中間部分的100個測試來計算——因為那時被試已經注意到紅燈亮的次數比藍燈多,從而開始在70%的測試中預測紅燈會亮了。在100次測試中有70次紅燈亮了,所以被試在這70次中有70%的正確率(因為被試在70%的測試中預測紅燈會亮),也就是說,被拭在70次中有49次正確的預測;100次測試中有30次藍燈亮了,被試在這30次中有30%的正確率(因為被試在30%的測試中預測藍燈會亮),也就是說,被試在30次中有9次正確的預測。因而,在100次測試中,被試的正確預測是58次。但是,請注意,這是多麼可憐的成績啊!如果被試在注意到哪一盞燈亮得比較多后,就總是預測那盞燈會亮——在本實驗中,就是注意到紅燈亮的次數比較多,因此就總是預測紅燈會亮(姑且稱之為「百分百紅燈策略」),那麼,他在100次測試中會有70次正確的預測。雖然在藍燈亮的30次測試里,被試將沒有一次正確的預測,但是總準確率仍然高達70%——比在紅燈與藍燈之間來回變換以追求「百發百中」的58%的準確率要高12個百分點!

試圖解釋偶然性|事件的傾向

小結

在心理學中也存在這樣的傾向:研究者試圖解釋一切,希望其理論不僅能解釋行為中系統的、非隨機的成分,還要能解釋任何細微的變異。這種傾嚮導致了不可證偽的心理學理論的泛濫,既包括個人提出的理論,也包括那些看似科學的理論。「心理歷史學」的奉行者常常犯下此類錯誤。一個著名人物生命中的每一個細小的變化及轉折,都經由精神分析學派的理論在心理歷史中得以詮釋。大多數心理歷史事件存在的問題是,不是它們解釋得太少,而是它們解釋得太多。這一研究方法的奉行者很少承認一個人的一生是由許多偶然因素決定的。