0%
第5章 相關和因果——用「烤箱法」避孕

第5章 相關和因果——用「烤箱法」避孕

戈德伯格有一類這樣得來的證據:研究者不僅觀察相關性,還靠真正地操縱關鍵變數來收集數據(有關控制操縱,將在下一章進一步討論)。這種方法經常要創造一些通常極少會自然出現的條件——說戈德伯格設計的特殊條件不會自然出現,無論怎樣強調都不會過分。
考試成績是許多不同變數的函數,這些變數彼此之間又是相關的。為了評估公立學校和私立學校的好壞,我們需要進行更為複雜的統計,而不僅僅是學校類型和學業成就之間的相關。例如,學業成就和家庭背景中許多不同指標都有關係,如父母的教育程度、父母的職業、社會經濟地位、家中藏書的數量以及其他一些因素。這些特徵都與是否把孩子送到私立學校有關係。因此家庭背景是一個潛在的第三變數,可能會影響到學業成就和學校類型之間的關係。簡言之,學業成就可能和學校質量沒有任何關係,而結果可能是:家境優越的孩子學習更好,更有可能進入私立學校。
在一些情境下,虛假相關很容易出現。這也正是選擇性偏差非常容易出現的原因。「選擇性偏差」這個術語指的是特定主體和環境變數之間的關係,當不同生理、行為、心理特點的人們選擇不同類型的環境時,就有可能出現選擇性偏差。選擇性偏差造成環境特徵和行為-生物特徵之間的虛假相關。
縱觀這場辯論,許多懷有政治目的的人試圖不斷地提出證據,用以說明教育質量和教師的薪資水平、班級規模是沒有關係的,儘管已有許多研究表明這二者都非常重要(Ehrenberg, Brewer, Gamoran, & Williams, 2001; Finn & Achilles, 1999)。他們所提到的證據當中,有一個是50個州的SAT(學術能力評估測試)的成績。這個測試的參加者是有意升入大學的高中生,測試中的學生平均分確實表明,學生成績和教師薪資水平、教育的支出是沒有關係的。即使有關係,其趨勢看起來也與期望的方向相反。在許多州,教師薪資水平很高,但是SAT的測試成績很低,有些州教師的薪資水平在全國工資水平排行墊底,而學生的SAT測試成繢卻很高。對這組數據的仔細審視給我們上了另外一課:
戈德伯格確信糙皮病是不會傳染的,也不會通過患者的體液傳播,他給自己注射了一名患者的血液,還吃進一名患者喉嚨和鼻子內的分泌物。此外,他還選擇了兩個病人:一個有皮癬癥狀,另一個有腹瀉。他從皮癬處刮掉鱗屑,然後和該病人的4毫升采液混合到一起,然後再加上相同數量的液體排泄物,最後與4小撮麵粉揉在一起做成小藥丸。戈德伯格、戈德伯格的助手以及戈德伯格的妻子自願服下這些藥丸。(Bronfenbrenner & Mahoney, 1.975, p.11)
在這個例子中,我們可以猜想,這種關係之所以存在,是因為「避孕工具的使用」和「家庭中家用電器的數量」這兩個變數通過與這兩種變數都相關的其他變數聯繫起來。教育可能會是中介變數之一。我們知道,教育水平與避孕工具使用和社會經濟地位都有關係。現在我們所需要的就是這樣一個事實:經濟水平高的家庭會擁有更多的家用電器,我們都會有這樣的聯想。當然,其他的變數也可能會在二者的關係中起到中介作用。但是,無論「家用電器的數量」和「避孕工具使用」之間的相關有多麼強,這種關係都不能說明它們之間存在因果關係。
糙皮病的歷史說明,如果依據相關研究來制定社會和經濟政策,必將使人類付出慘痛的代價。但這並不是意味著我們永遠不要使用相關研究的證據。恰恰相反,在許多場合,我們必須用到相關(見第8章),而在某些情況下,只要有相關就夠了(例如,當我們的目標是預測而不是決定原因的時候)。科學家們經常不得不使用不充分的知識來解決問題。重要的是,我們在運用相關性證據的時候要謹慎小心。像「糙皮病-污水」這樣的案例,在心理學研究的每個領域內都頻頻發生。這個例子也揭示了「第三變數問題」:事實上兩個變數之間的相關——這個例子中是糙皮病的發病率和污水處理條件——並不意味著這兩個變數之間有直接的因果關係,相關之所以產生,是因為這兩個變數都分別與第三變數相關——這裡是飲食——而這個變數沒有被測量。像這種污水處理條件和糙皮病之間的相關,我們通常稱之為「虛假相關」:相關的產生不是因為兩個變數之間存在一個可以測量的直接的因果九_九_藏_書聯繫,而是因為這兩個變數都與第三變數相關。
第二個選擇性因素則更加微妙。在那些教育質量高的州里,許多學生在高中畢業后,更傾向於繼續接受教育。在這些州,參加SAT考試的學生比例高,這其中也包括一些學習成績較差的學生。而在那些有著高輟學率、低教育質量的州中,想繼續接受大學教育的學生比例很低。在這些州中,最終參加SAT考試的學生代表的是這些州中學習成績比較好的那些人。因此,他們的平均成績自然要高於那些大部分人都參加升學考試的州。

小結

下面我們來看一個發生在現實生活中的例子。多年以來,有關公立學校和私立學校教學質量的爭論甚囂塵上。從這場爭論中得出的一些結論,很生動地展示了從相關證據推出因果關係的弊端。私立學校和公立學校的好壞是一個實證性問題,可以使用社會科學中的調查研究方法來辨別真偽。但是,這並不意味著只要這個問題是個科學問題、有可能獲得解決,就是一個非常簡單的問題。所有鼓吹私立學校優越性的人都潛在地意識到這一點,因為他們在維護自己的觀點時,常常引用這樣一個經驗性的事實:私立學校學生的成績要好過公立學校。儘管這個事實無可辯駁——各種研究中有大量一致的教育統計數據,但問題在於,用這些學生的成績數據就推出結論,即私立學校的教育本身導致了較高的分數,這麼做是否合適?
避孕方法的例子很容易讓我們理解這一章的主旨:有相關,並不意味著必然有因果關係。本章中我們將會討論阻止我們做出因果推論的兩大問題:第三變數問題和方向性問題。我們還將會討論選擇性偏見是如何導致第三變數問題的。
本章的主旨是想傳達這樣一個理念,兩個變數之間僅僅存在相關,並不能保證一個變數的變化就會導致另一個的變化,也就是說,相關並不意味著因果關係。在第三變數問題里,兩個變數之間的相關並不意味著它們之間存在直接因果路徑,因為相關的產生可能是由於這兩個變數或許都與未被測量的第三變數有關。事實上,如果潛在的第三變數也經過了測量,就可以用相關統計,如偏相關(第8章將會討論)來評估第三變數是否決定了這種關係。讓相關統計的解釋變得困難的另外一個原因,就是方向性問題。實際上,如果兩個變數有直接的因果關係,因果關係的方向是不能根據相關來判斷的。
到目前為止,我們的討論主要圍繞變數間相關所涉及的兩種誤區。其中一種叫做方向性問題,已經通過眼球運動和自尊的例子進行了闡述。當變數A和變數B之間存在相關時,在斷定A的變化引起B的改變之前,我們必須清楚因果關係的方向可能是相反的,即從B到A。第二種是有關第三變數的問題,此問題已經通過糙皮病的例子(以及烤箱—節育和私立學校—學業成就的例子)加以論述。兩個變數之間的相關並不能預示任何方向上的因果,因為當這兩個變數都和第三變數相關時,該相關還是會出現。
相關性證據的局限性並不都像「烤箱」例子那樣容易被識別。當因果關係對我們來說顯而易見時,當我們抱有根深蒂固的偏見時,或者當我們的解釋被理論定勢所主宰時,就會很容易地把相關當作因果的證據。

方向性問題

如果能夠採用某種方式操縱變數,並能夠因之做出科學的因果推斷,就沒有理由僅憑相關證據做出因果推論。而讓人苦惱的是,當涉及心理學主題時,僅根據相關就得出結論的做法卻是普遍存在的現象,在心理學知識對解決社會現實問題愈發重要的今天,這種傾向所造成的損失也與日俱增。在教育心理學界,一個廣為人知的例子很好地詮釋了這一點。
戈德伯格對其他人提出的因果機制進行了操作,結果顯示該機制是無效的,儘管如此,對他自己提出的因果機制進行檢驗仍然非常必要。戈德伯格選擇了來自密西西比州監獄農場的兩組犯人,這些人都是沒有患糙皮病的,並且都是自願參加實驗。其中的一組人被給予高碳水化合物、低蛋白質的食物,這種類型的食物是戈德伯格懷疑引起糙皮病的原因。另一組被試被給予(營養成分)更均衡的飲食。5個月後,低蛋白質的這一組患上了糙皮病,而另一組卻沒有絲毫的患病跡象。戈德伯格的理論遭到了一些人的反對,這些人出於政治動機而否認貧困的存在。經過長期的抗爭,戈德伯格的假設終於被人們所接受,因為他的假設與實驗證據的契合程度是其他任何假設所不能比擬https://read.99csw•com的。
因此,很明顯,鼓吹私立學校能夠提高教育成就,就跟討論節制生育需要用「烤箱」一樣沒什麼分別。學業成就和私立學校相關,不是因為任何直接的因果機制,而是因為私立學校中學生的家庭背景和一般認知水平與那些進入公立學校的學生相比是不一樣的。
無論是戈德伯格,還是其他的志願者,都沒有染上糙皮病。簡言之,戈德伯格創造了這個傳染疾病可能傳播的所有條件,結果平安無事。
總之,這一章提供給讀者的規則很簡單:提防選擇性偏差的發生;當只有相關時,應避免因果推論。不可否認,複雜的相關數據里確實存在著有限的因果關係。同樣不可否認的是,相關的證據有助於證明假設的聚合效度(見第8章)。然而對於心理學知識的消費者來說,寧可站在懷疑的角度,也不要被那些錯誤地暗示了因果關係的相關所蒙蔽。
這些較為複雜的相關統計方法,能夠排除第三變數的影響,但並不總是會削弱原有相關的強度。有時候,在排除第三變數之後,兩個變數之間的原有相關仍然存在,這個結果本身就能提供一些信息。這樣的結果說明,原有相關並不是由第三變數所導致的虛假相關。當然,並不排除其他變數也會導致虛假相關。
一位叫約瑟夫·戈德伯格(Joseph Goldberger)的醫生對這種解釋非常懷疑,在美國公共衛生部部長的指示下,戈德伯格針對糙皮病開展了許多研究。他認為糙皮病是由於營養不均衡的飲食引起的,簡而言之,是美國南部普遍的貧困造成的。許多的患者賴以生存的都是高碳水化合物、蛋白質含量極低的飲食,如很少量的肉類、蛋類、牛奶,以及大量的穀類、燕麥和玉米粥。戈德伯格認為污水處理條件和糙皮病之間的相關在任何一個方面都無法反映因果關係(和烤箱控制生育的例子一樣)。他認為根本原因在於,擁有清潔管道的家庭通常也都是經濟狀況良好的家庭,經濟上的差異也會反映在他們的飲食上,經濟狀況好的家庭在其飲食中包含更多的動物蛋白。

選擇性偏差

托馬斯、亞歷山大和埃克蘭德(Thomas, Alexander, & Eckland, 1979)提供了數據分析方面的一個好例子。這些研究者發現,高中生是否進入大學和這個學生的家庭社會經濟地位有關。這是一個重要發現,足以動搖我們這個社會的核心價值——實現目標靠的是個人能力。它表明,一個人的成功取決於這個人的經濟地位。但是在下這個結論之前,我們必須首先考慮一下其他假設。這就是:升入大學和社會經濟地位之間的相關是一種假象。其中一個非常明顯的第三變數就是學業能力,它可能與升入大學和社會經濟地位都有關係,如果這個變數被排除出去,這兩個變數之間的相關就會消失。在學業能力被排除后,研究者計算出的數據發現,升入大學和社會經濟水平的相關仍然顯著。因此,高收入階層的孩子更容易進入大學不能完全歸因於學業能力的不同。當然,這個發現不能排除這種可能性:其他一些變數導致了升入大學和社會經濟水平之間的相關,但是能夠用這樣一種再分析來排除學業能力對兩者相關的影晌,這本身就在理論及實踐方面具有很重大的意義。
在行為科學中,選擇性偏差是造成諸多虛假相關的罪魁禍首。事實上人們在一定程度上選擇他們的環境,並人為創造了行為特性和環境變數之間的相關。正如戈德伯格的例子所闡述的那樣(在接下來的兩章中我們將會進一步討論),確保選擇性偏差不會搗亂的唯一方法,就是在操縱所有變數的情況下進行真正的實驗。
但是,選擇性偏差並不總是那麼容易辨別。尤其是當我們事先就期望看到因果聯繫時,這種偏差經常會被忽略,就像在「自尊」的例子中那樣。充滿誘惑的相關性證據加上固有的偏見,就能夠欺騙最聰明的頭腦。下面讓我們看一些事例。
在《教育研究者》(Educational Researcher)雜誌中,心理測量學家霍華德·維納(Howard Wainer, 1993)分析了一篇文章,此文是美國傳統基金會所做的一個研究,發表在1993年6月22日的《華爾街日報》上。這個基金會是一個帶有強烈意識形態傾向的智庫,一貫反對教育投入——你猜是為什麼呢?——SAT分數低的州往往是教育投入較高的。維納的文章不僅揭示出選擇性偏差引發的這種後果,還證明了如果測試使用有代表性的樣九九藏書本,而不是自我選擇的樣本來分析(National Assessment for Educational Progress, NAEP),這種關係就會呈現相反的情況:教育花費高的州有高的SAT成績。
自從100年前關於閱讀的科學研究開始以來,研究者們就知道,眼動模式和閱讀能力之間存在著相關。閱讀能力差的人,其眼動軌跡是不規則的,表現為更多的回掃(從右向左的運動),在每一行上的注視時間(停頓)更長。基於這種相關,一些教育工作者假設,眼球運動技能的缺失是造成閱讀問題的原因,因此許多「眼球運動訓練計劃」在小學生中展開和實施。在查明這一相關是否真的說明「不規則的眼球運動會導致低下的閱讀能力」之前,這些訓練計劃已經開展了很長時間。
第1章中討論過一個類似的例子。在教育和社會服務領域里有一個非常流行的觀點:學業成就問題、藥物濫用、青少年懷孕以及其他一些問題行為都是低自尊造成的。這一說法假定,此因果關係的方向很明顯:低自尊導致行為問題,高自尊帶來高的學業成就和其他領域的成績。這種方向性因果關係假設為許多提高自尊的教育計劃提供了動力,這個問題和眼球運動那個例子是一樣的:僅僅因為存在相關就推出一個方向性的因果假設。事實證明,就算真的存在因果關係,自尊和學業成就之間的關係更可能呈相反的方向;高學業成就(包括生活中其他方面)導致高自尊(Baumeister, Campbell, Krueger, & Vohs, 2003; Stout, 2000)。
維納(Wainer, 1999)給我們講了一個二戰期間的故事,這個故事提醒我們選擇性偏差違背常理的一面。他提到一位飛機分析師,這個分析師一直試圖通過分析飛機被子彈擊中的彈孔分佈,來確定飛機上的哪個部位是應該放置加固防彈層的位置。他最後的決定是:把加固防彈層放在返航機上沒有彈孔的地方。他的理由是,子彈襲擊飛機各個部位的幾率是均等的,所以,如果一架飛機能返回,就表示這架飛機被子彈擊中的地方必定不會對飛機造成致命損傷。那些沒有彈孔的地方,看來都是要害,因為該部位如果被擊中,飛機可能就不會返航。因此加固防彈層應該安裝在返航機沒有被擊中的部位!
讓我們通過一個例子來了解選擇偏差是如何產生虛假相關的。請快速說出一個州名,在這個州里,由呼吸系統疾病導致的死亡率高於平均水平。當然,答案之一是亞利桑那州。什麼?等等!難道亞利桑那州沒有清潔的空氣嗎?難道洛杉磯的煙霧瀰漫得如此之遠?難道鳳凰城的郊區環境已經變得那麼差了嗎?不是,肯定不是!讓我停下來想一想。可能亞利桑那州的確有清潔的空氣,可能患有呼吸疾病的人都願意搬到這裏,然後他們死在了這裏。這樣就對了。如果我們不夠認真,就會出現上面所說的那種情形:我們可能會受到誤導,認為是亞利桑那州的空氣害死了這些人
這個問題的答案要用選擇性偏差來解釋。SAT和學校通常選擇的那些標準化考試不同,在標準化考試中,所有學生一律都要參加。但SAT並不是所有的高中生都參加的,因而存在選擇性偏差(Hauser,1998; Powell & Steelman, 1996; Taube8cLinden, 1989; Wainer, 1989)。只有那些希望進入大學的學生參加這個考試。這個因素就能夠解釋州與州之間的平均分為何存在差異,同時解釋了為什麼一些州有最好的教育體制,在SAT考拭中的平均分卻很低。
在20世紀初期,數以萬計的美國南部民眾罹患並死於一種叫做糙皮病的疾病(大約每年100000人死亡)。糙皮病被認為是由一種不明微生物引發的傳染性疾病,其主要癥狀是頭暈、嗜睡、潰瘍、嘔吐和嚴重腹瀉(Chase, 1977, p.205)。此後,許多來自全國糙皮病研究學會的醫生都認同這樣的證據:糙皮病和衛生條件有關。這並不令人吃驚。家在南卡羅來納州斯帕坦堡的人們似乎總是遠離糙皮病的困擾,因為他們有自來水管道和良好的污水處理設施。這種相關恰好驗證了這樣的觀點:由於糟糕的衛生條件,傳染性疾病是通過糙九-九-藏-書皮病患者的排泄物傳播開來的。
這個結果恐怕不會促使你提出這樣的建議:在高中發放免費的烤箱以解決青少年的懷孕問題。但是,你為何不會有這樣的想法呢?電器和避孕工具使用之間的相關性很高,在眾多被測量的變數中,這個變數是唯一最準確的預測因子。我希望你的回答會是:問題關鍵在於這兩個變數間關係的「性質」而非「強度」。開展「免費烤箱計劃」預示著這樣一種觀念:烤箱導致人們使用避孕工具。而實際上我們會將這種建議視為一種荒唐的方案,至少在上面所舉的這個顯而易見的例子中,我們會認識到,這兩個變數可能有相關,但不是因果關係。
鮑威爾和斯蒂爾曼(Powell & Steelman, 1996)利用先前提到過的偏相關技術證實了這種關係。他們發現,一旦在統計上控制了每個州參加考試的學生在比例上的差異,那麼每個學生的教育支出每增加1000美元,這個州的SAT考試平均成績就會提高15%。儘管大多數的證據都無可辯駁地表明,如果不進行統計校正,選擇性偏差會讓州與州之間SAT成績的比較變得毫無意義,但媒體和政客們仍在繼續使用未校正的分數來達到他們的政治目的。
現在已經清楚了,眼球運動與閱讀能力的相關反映了一種與之前所想象的完全相反的因果關係。不規則的眼動並不導致閱讀障礙(Rayner, 1998),相反,是緩慢的單詞識別和理解困難導致了不規則的眼動。當教會兒童有效地識別單詞和更好地理解文字后,他們的眼動軌跡變得平順了。訓練兒童的眼球運動和提高其閱讀能力是沒有關係的。
最近十幾年以來,研究者們已經明確指出,文字解碼和語音加工方面的語言問題是閱讀障礙存在的根源(Rayner, Foorman, Perfetti, Pesetsky, & Seidenberg, 2001, 2002; Snowling & Hulme, 2005; Stanovich,2000; Vellutino, Fletcher, Snowling, & Scanlon, 2004),而幾乎沒有眼動模式導致閱讀障礙的案例。但是,如果到大部分中等規模以上的學校的儲藏室里仔細翻一翻,都能找到布滿灰塵的眼球運動訓練儀器,這表明數以千計的買設備的錢被浪費了,這就是把相關視為因果證據的後果。
從關於「美國教育質量」的全國性討論中可以很容易地看到選擇性因素的重要性,這場討論已經在美國全國範圍內持續了近二十年。在這場辯論中,公眾被各種教育統計數據所淹沒,但研究者卻沒有提醒公眾,警告他們避免從相關數據去推論因果關係,因為相關數據內含有大量具有誤導性的選擇性偏差。
幸運的是,還有許多複雜的相關統計方法,例如多元回歸、偏相關、路徑分析(統計學的發展部分要歸功於心理學家),這些複雜的統計方法能夠去除其他變數的影響、提出公因子或定義協變數之後重新計算兩個變數之間的相關。來自杜克大學的艾利斯·佩奇和蒂莫西·凱斯(Ellis Page & Timothy Keith, 1981)則使用更為複雜的統計技術,分析了一系列關於高中生教育的統計數據,這次統計數據的收集是在國家教育統計中心(NCES)的資助下進行的。他們發現,當反映學生家庭背景和一般智力能力的變數被排除后,學業成就和學校類型之間幾乎就沒有一點關係了。其他研究者也確認了他們的研究結果(Berliner & Biddle, 1995; Carnoy, Jacobscn, Mishel, & Rothstein, 2005)。
選擇偏差導致虛假相關是多麼容易。
關於SAT分數的這個例子也為我們提供了一個反面教材,那就是:公眾如果缺乏本書所教授的簡單方法論和統計思維技能,想糾正那些誤導性的數據是何等地困難。在寫於1983年的本書的第一版中,我就將SAT分數的錯誤使用源於選擇性偏差這個例子收錄進來。在十多年以後,也就是1994年的第四版中,我談到了一篇文章,這篇文章是印第安納州的教授布賴恩·鮑威爾(BrianPowell,1993)寫的,文章分析了由政治專欄作家喬治·威爾(George Wel1)在1993年所寫的一篇專欄文章,你可以猜測一下文章的內容……威爾反對公共教育支出,因為在SAT測試中取得高分的州,並沒有高的教育https://read.99csw.com支出。鮑威爾(1993)指出,威爾挑出的那些SAT分數特別高的州——愛荷華州、北達科他州、南達科他州、猶他州和明尼蘇達州——參加SAT考試的學生比率分別為5%、6%、7%、4%和10%,然而在美國參加SAT考試的總比率是40%以上。原因就是,在以上這些州中,要想進入公立學校,必須參加ACT考試,只有那些計劃去州外有名望的私立學校讀書的學生才參加SAT考試(Powell, 1993, p.352)。與之相反,在威爾列舉的新澤西州,SAT分數很低,教育支出卻很高,其中有76%的高中生參加了這個考試。顯然,相比新澤西州,在南、北達科他州參加SAT考試的學生配稱得上是一支「精銳之師」。
幾年前,在中國台灣地區曾開展過一次大規模的研究,目的是調查哪些因素和人們對避孕工具的使用有關。一個由社會學家和內科醫生組成的大型研究團隊收集了有關環境和行為變數方面的大量數據。研究者比較感興趣的是,哪種變數能夠最準確地預測避孕方法。數據收集上來之後,研究者發現,有一個變數和使用避孕工具的相關最強,這就是:家庭中家用電器(烤箱、風扇等等)的數量(Li, 1975)。

為什麼戈德伯格的證據更好

但是,請等一下!為什麼戈德伯格的因果推斷就一定是對的呢?畢竟,兩派人馬都是坐在那裡,根據相關數據推論什麼才是造成糙皮病的原因的。為什麼醫學會的醫生們不能說戈德伯袼的相關同樣也是誤導性的呢?為什麼戈德伯格能夠推翻別人的假設——一種微生物通過糙皮病患者的排泄物傳播,而這種傳播是因為不完善的污水處理設施造成的?戈德伯格對糙皮病的判斷還涉及一個小細節,這個細節我剛才沒說:戈德伯格吃下了糙皮病患者的排泄物。
安德森等(Anderson & Anderson, 1996)描述了他們是如何來檢驗關於暴力的地區差異理論的,他們通過檢驗一系列不同的理論看其是否能夠對所收集的數據做出解釋。他們採用偏相關技術來進行此項研究。曾有研究表明美國南部地區的暴力犯罪高於北部地區,他們檢驗了「熱假設」——令人不適的高溫增強了侵犯性動機和攻擊性行為(p.740)。他們發現城市平均氣溫和暴力犯罪率之間存在相關,這並不令人奇怪。但是從統計上控制一些變數,如失業率、個人平均收入、貧困率、教育程度、人口規模及其他一些變數之後,氣溫和暴力犯罪之間的相關仍然顯著。這就使得「熱假設」理論的可信度大大提高了。
選擇性因素在兩個方面操縱了SAT的得分。首先,一些州立大學需要ACT(美國大學考試)的成績,而不是SAT分數。所以這些州中,只有那些打算去州外讀大學的學生才會參加SAT考試。比起那些平均水平的學生,這些學生中的大部分最有可能擁有更好的家庭條件或者更高的學術才能。這種情況也發生在密西西比州和加利福尼亞州的考試中。密西西比州僅有4%的高中生參加SAT,然而加利福尼亞州卻高達47%(Powell & Steelman,1996)。

第三變數問題:戈德伯格與糙皮病

來自臨床心理學的例子可以表明,選擇性偏差問題是多麼地具有欺騙性和違背常理。研究數據有時會顯示,接受心理治療的人在各種成癮症——如肥胖、吸毒、吸煙——的治愈率方面,要低於那些沒有接受過心理治療的人(Rzewnicki & Forgays, 1987; Schachter, 1982)。你想知道原因嗎?原因並不是因為心理療法使得成癮的行為更加難以改變,而是因為那些尋求心理治療的人的成癮問題更複雜和棘手,而且很少能夠自愈。
舉例來說,在進一步的檢驗中,密西西比州學生在SAT考試中的得分高於加利福尼亞州學生(Powell & Steelman,1996; Taube & Linden, 1989),而且差異是非常顯著的,密西西比州比加州的平均分要高出100分。而密西齒比州的教師薪資水平在全國是最低的,這無疑會讓那些鼓吹削減教師工資的人們彈冠相慶。但是,請等一下!密西西比州的學校真的好於加利福尼亞州?前者的教育水平真的高於後者?當然不是。幾乎任何一個客觀的指標都顯示,加利福尼亞州的學校更好(Powell & Steelman, 1996)。但是如果這是真的,那麼SAT的成績又該如何解釋?