第7章「但是這不是真實的生活！」——「人為性」批評和心理學_對「偽心理學」說不_基思·斯坦諾維奇

第7章「但是這不是真實的生活！」——「人為性」批評和心理學

為什麼自然性並非總是必要的

認知、社會和臨床心理學家也研究了人類的各種決策行為。這個研究領域里大部分原始的研究都是在實驗室里完成的，使用大學生作被試，而且採用高度人為化的任務。然而，從這些研究中得出的決策行為原則在很多非實驗室環境中都得到了重現，包括銀行家對股票價格的判斷、賭場賭博、精神病醫生對病人行為的預測、經濟市場預測、軍事情報分析、全美橄欖球聯賽的下注、工程師對修理時間的估計、房地產經紀人對房價的估計、商務決策以及醫生的診斷——這些原則現在也應用於個人理財諮詢的實踐領域（Bazerman, 1999, 2001; Belsky & Gilovich, 1999; Goldstein & Hogarth, 1997; Hammond, 1996; Tassoni, 1996; Zweig, 2001, 2002）。

隨機分配是真實驗所必需的條件。實驗人員將被試分為實驗組和控制組，當每一名被試被分到實驗組的機會和被分到控制組的機會相等時，則實現了隨機分配。為了達到這一點，常會用到像擲硬幣這樣的隨機化手段（更常用的是一種特殊的隨機化數字表格）——因為它在給被試分組時沒有任何偏向。

正如先前提到的，認知心理學的研究成果通過了重複驗證。信息加工的許多基本規律在全世界許多實驗室中得到驗證。人們可能不太知道，如果密歇根大學的一名心理學家獲得一項重要的研究成果，那麼類似的實驗將很快在斯坦福大學、明尼蘇達大學、俄亥俄州立大學、劍橋大學、耶魯大學、多倫多大學等大學進行。通過這種檢驗，我們將很快知道這項結果是不是由於密歇根州被試的獨特性或特殊的實驗環境所造成的。

然而，把應用型心理學研究看做典型的心理學研究是錯誤的。心理學（或其他學科，就這一點來說也是如此）的大部分研究都有著不同於應用的目的。大多數研究的預測層次是從理論到特定研究情境的預測。大多數研究的結果只能間接通過理論修改而被應用，這些理論與其他科學規律共同應用於一些實踐性問題（Nickerson, 1999）。簡而言之，大部分理論研究追求的是對心理過程的理論驗證，而不是把研究結果推廣到現實中的某一特殊情境中去。

穆克（1983）提醒我們考慮一下海奇特的實驗環境是完全非自然的。（非隨機取樣的）被試在暗室里進行反應，根據他們是否察覺到微弱的紅色閃光，回答「是，我看得見」或者「不，我看不見」。正常情況下，我們不會在日常生活中對微弱的紅光作「是」或「否」的反應。然而由於海奇特並不考慮將自己的研究成果推廣到那些在暗室里對紅光做「是」或「否」的反應的個體中去，所以現實生活中這種情況是否真的發生過無關緊要。海奇特所關心的是，如何根據實驗室中建立的事實來驗證相應的理論，從而能解釋視覺系統所特有的一些基本過程，如暗適應。他並不關心他的實驗情境是否符合現實世界的情況，而是關注是否能充分分離出他想研究的特殊視覺過程。

正確看待「真實生活」和「大二學生」問題

教育心理學家也提出過大二學生問題。例如，教育心理學家聯合發展心理學家以及其他教育研究人員，構建了測量基本認知技能的內容，這些內容能在一定程度上準確預測學業成績，例如閱讀習得率。這些內容的預測準確度不受社會經濟地位和種族的影響，也不受地理分佈和校區的影響。

事實上，如果科學家完全禁錮在「自然」條件下觀察，那麼一些現象就不可能被發現。探索物質本質特徵的物理學家們建造巨大的加速器來誘發基本粒子之間的碰撞。碰撞中產生的一些副產物是存在時間不到十億分之一秒的新粒子。然而，這些新粒子的屬性卻有助於解釋原子結構理論。許多新粒子在世界上一般是不存在的，即使存在，我們在自然狀況下也沒有機會觀察到它們。因此，幾乎沒有人質疑物理學家們的研究方式。為了對宇宙有更深刻的理解，即使採用一些不常見的甚至是怪異的方法，也是合情合理的。但不知為什麼，物理學家用起來合理的方法，心理學家使用起來，就常被認為是不合理的。

許多人質疑心理學研究成果的代表性，他們過於關注研究的被試，而不關心實驗設計的細節。然而，心理學的許多領域中，研究結果更多受到後者的影響而非前者，例如知覺基本過程的研究。在基本的信息加工過程、大腦的基本結構以及視覺系統的特徵方面，美國蒙大拿州的人和佛羅里達州的人都非常相似。另外，這些特徵和被試的父母是不是修補匠、裁縫或者教授沒有任何關係。

禁錮于真實生活條件會妨礙我們發現許多新事物。例如，生物反饋技術現在被廣泛應用於各種領域，比如用於控制周期性偏頭痛和緊張性頭痛、治療高血壓，以及放鬆訓練（deCharms et al., 2005; Maizels, 2005; Miller, 1985）。研究表明，如果通過視覺或聽覺的反饋能夠監測到體內正在進行的生理過程，那麼人類就能學會在一定程度上控制這些過程。這項研究促進了上述生物反饋技術的發展。當然，因為人類本身並不具備通過外部反饋來監測自身生理功能的能力，所以，如果不是在特殊的實驗室條件下，人們將很難發現人類有能力控制自己的生理過程。自然條件下的觀察是永遠無法發現這一點的。

一些心理學研究屬於應用型研究，它們的目標是把研究結果直接應用於特定情境。在這樣的應用研究中，研究的目的是要將結果直接推廣到自然情境中，樣本的隨機化和條件的代表性就顯得尤為重要，因為研究結果將會直接得到應用。然而，大多數心理學研究不屬於這種類型，而是屬於基礎研究，用以驗證有關行為潛在機制的理論。在大部分基礎研究中，研究結果通過理論上的修正得到間接應用，從理論產生到應用於某些實踐性問題需要一段時間。在這種類型的基礎研究中，被試的隨機取樣和情境的代表性不是關鍵問題，因為這類研究的重點在於驗證理論的普遍性。實際上，在用於驗證理論的基礎研究中，人為的環境條件是有意創設的，因為（正如前一章所描述的）這有助於把研究的關鍵變數從所要hｔtｐs://reａｄ•９9ｃsw•ｃoｍ控制的無關變數中分離出來。因此，心理學實驗「不像是真實的生活」這個事實其實是一種優勢而非缺點。

然而有時候，類似「這不是真實的生活」的抱怨源於對心理學實驗研究目的的另一種誤解，產生這種誤解的原因是非常容易理解的。媒體的宣傳使許多人對調查研究開始熟悉起來，特別是選舉中的民意調査。現在人們對選舉投票的一些重要特徵越來越了解。具體而言，為了保證民意測驗的準確性，媒體對隨機取樣、樣本代表性等概念更加關注。這種關注導致許多人錯誤地認為，隨機取樣和代表性是所有心理學調查研究的必要條件。因為心理學研究很少使用隨機的被試樣本，如果根據外行人所相信的隨機取樣標準，那麼許多心理學的研究成果都會遭到詆毀，那些批評心理學研究無法反映真實生活因而是無效的論點也會受到強化。

由於公眾沒有意識到創造特殊條件的重要性，各類科學家都曾遭到過誤解，而心理學家是這種誤解的最大受害者。許多心理學家在向外行人展示關於某一行為的實驗證據之後，都聽到過這樣的嘆息：「可惜這不是真實的生活」。對這種批評的進一步討論，通常可以讓我們了解到大眾的一些觀念，比如，只有研究自然條件才能獲得知識，心理學的實驗室研究是怪異的，還不足以成為一門科學。

3.許多研究結果得到了重複，這使我們確信這些結果在很大程度上可以推廣到不同的地理分佈中，並且在較小程度上，也能推廣到具有不同社會經濟因素、家庭變數以及早期教育經歷的人群中去。50年前的大學生被試樣本恐怕基本來自於精英團體，如今卻完全不同，現在大學生的家庭背景能夠代表各階層的群體。

伯爾尼鮑姆（Birnbaum, 1999）用互聯網來解決心理學中的大二學生問題。他在實驗室里通過互聯網招募了一批參与者，並進行了一系列有關決策問題的實驗。實驗室中得到的結果全部在互聯網樣本中得以重現，而後者的取樣範圍要比前者廣泛得多——包含來自44個國家的1224名參与者（見Jaffe, 2005; Mc Graw, Tew, & Williams, 2000）。高斯林等人（Gosling et al., 2004）研究了大量互聯網參与者的樣本（361703人），並將之與發表過的510個傳統樣本的參与者比較，發現互聯網上的被試在性別、社會經濟地位、地區和年齡方面有著更廣泛的分佈。重要的是，他們發現，心理學眾多研究領域的研究結果，例如人格理論，用互聯網實驗和傳統方法的研究所得出的結果非常相似。

想想經典條件反射和操作性條件反射原理。這些原理及其詳細論述的規律，幾乎完全是從非人類被試的實驗發展而來的，比如鴿子、老鼠，其實驗情境也是高度人為化的實驗室環境。然而，這些原理已經成功地用於解決人類各式各樣的問題，包括自閉症兒童的治療、大量事實材料的教學、酗酒和肥胖症的治療、精神病院的病號管理以及恐懼症的治療等等。這僅是一小部分而已。

通向實際應用的道路是非常曲折和不可預料的。為了研究關節炎，德克薩斯西南大學醫藥研究中心的一組研究人員試圖通過遺傳的方式培養一批患有關節炎的老鼠。出乎意料的是，這些老鼠同時也患上了腸炎（Fackelman, 1996）。這個研究團隊「偶然創造出了有潰瘍性腸炎的老鼠，從而為科學家們研究人類疾病提供了動物模型」（Fackelman, 1996, p.302）。無論這些科學家是否在關節炎（原本想研究的問題）上取得了進展，現在看來他們似乎在潰瘍性腸炎的治療上做出了巨大的貢獻。

我們面臨一個問題，有時人們叫它「大二學生問題」；即，因為大二學生在大量的心理學研究中做被試，因此這些研究所得出的結果是否具有可推廣性受到了質疑。心理學家關心這一問題，是因為它在某些研究領域中的確是個問題。儘管如此，我們還是要正確地看待它，並且應該知道心理學家對這一批評有幾種合理的辯解。以下列出三點：

大二學生問題和關於代表性的批評大部分針對的是社會心理學，社會心理學經常用大學生被試在實驗室情境中進行研究，並試圖建立真實社會情境中的社會交往、群體行為和信息加工等理論（Kimda，1999）。然而，即使在心理學的這一領域，也有證據表明，實驗室得出的成果和理論，實際上確實預測出了不同類型的個體在各種情境下的行為。

隨機分配和隨機取樣不是一回事，牢記這一點的最好方法是弄清楚四種組合：非隨機分配的非隨機樣本，隨機分配的非隨機樣本，非隨機分配的隨機樣本，以及隨機分配的隨機樣本。大部分心理學實驗沒有使用隨機樣本，因為沒有這個必要。正如下一章將講到的，研究可以檢驗理論，我們所需要的只是一個方便取得的樣本。如果一個研究中使用了隨機分配的方法，那麼它就是一項真實驗，如果沒有使用，那麼它是一項相關調查。許多使用隨機取樣的研究沒有使用隨機分配，那是因為它們只是調查性研究，旨在尋找關聯——也就是說，這些研究屬於相關調查研究。然而，一些研究既使用了隨機取樣，又使用了隨機分配，那麼它們肯定是真實驗。

對「隨機取樣」的誤解

西莫爾·凱迪（Seymour Kety, 1974）也談到了氣丙嚷這一治療精神分裂症的特效藥物是如何在一些看似沒有關聯的科學研究中被發現的。凱迪強調，幾乎所有應用於精神分裂症治療方法的發現都與精神分裂症毫無關係！歷史一再證明，（通過讓科學家解決特殊的實踐性問題而）試圖控制科學發展方向只能阻礙發展進程而非促進。具有諷刺意味的是，急於讓科學家們解決實際問題，而不讓其考慮「其他事情」（基礎研究）的做法，被證明是最不切實際和目光短淺的。

心理學家對知覺過程的研究取得了令人印象深刻的進展，從中得出的規律和理論已用於解決各種各樣的問題，比如雷達監測系統、街燈照明以及飛機駕駛艙的設計（Nickerson，1992; Swets, Dawes, & Monahan, 2000; Wickens, 1992）。關於衰老對認知的影響，我們已經積九_九_藏_書累了許多新的認識（Salthouse, 2004），而這些新知識有可能會直接幫助我們設計出幫助認知喪失者恢復其能力的訓練方案（Dixon & Backman, 1995）。

當然，並不是所有的心理學研究成果都能重現（見Carroll & Nelson, 1993）。相反，結果無法重現的實驗經常出現，而它們往往比結果可以重複的實驗更具指導意義。但是，在認知心理學中，重複實驗的失敗幾乎很少是被試的獨特性造成的。相反，大部分是因為實驗刺|激和方法的細微差異。通過仔細地分析要產生一個現象究竟需要哪些實驗條件，科學家們對現象有了更精確的理解，這為建立一個更精確的理論奠定了基礎。

隨機取樣涉及的是如何選擇被試進行研究。如前所述，並不是所有研究都要求隨機取樣，但當它成為必要條件時（例如在調査研究、市場調查或是選舉時的民意調查中），我們則需要用一種方法從總體中抽取一個樣本，這種方法要確保總體中的每一個成員都有同等機會被選為樣本，被抽中的樣本就成為隨後調査研究中的被試。有一點非常重要，這種隨機抽樣的調查研究既可能是相關研究，也可能是一個真實驗。只有使用了隨機分配的方式，才有可能成為一個真實驗。

儘管如此，心理學家應當始終注意他們的實驗結論不要太過依賴於某一種方法或某一特殊被試群體。這一點將在下章討論。事實上，心理學的一些領域確實被大二學生問題折磨得夠嗆（Jaflfe, 2005; Peterson, 2001; Wintre, North, & Sugar, 2001）。作為大二學生問題的一劑良藥，跨文化心理學仍然是一個亟待發展的領域。然而，研究型心理學家對於自我批評的高度重視，給了我們一個對此持樂觀態度的理由（見第12章; Anderson & Gunderson, 1991; Henriques, 2003, 2004，2005; Jaffe, 2005; Kimble, 1999; Machado, Lourenco, & Silva, 2000; Proctor & Capaldi, 2001）。事實上，許多心理學家因為將「批判」作為其本職工作而享譽學界（Leary, 2001; Robinson, 2001）。每年的各類科學雜誌上，都會有文章提醒心理學者注意其方法上的漏洞，或是指出大二學生問題。後者在心理學中是一個受到廣泛關注的問題，沒有心理學者尚未意識到這一點。因此，儘管我們不應忽視這一問題，同時也應正確看待它。

但是，如果實驗結果沒有被重現，那麼心理學的研究成果如何應用？如果科學家們沒有在所有的細節上達成一致，知識和理論並不完全站得住腳，那麼如何證明這些結果的應用是合理的呢？這種對心理學發現的擔心是很常見的，因為人們沒有意識到，在其他科學中，結果和理論經常在完全確立之前就開始應用了。當然，第2章中已經清楚地闡述過，所有的科學理論都有可能被修訂。如果我們在應用科學研究結果之前必須確定知識是完全正確的，那麼應用就不會發生了。所有領域的應用型科學家盡最大努力使用最準確的信息，同時也會意識到這些信息有可能是錯誤的。

小結

隨機分配和隨機取樣兩個詞里都包含「隨機」，因此許多人以為它們所指的是一回事。事實上，它們是非常不同的概念，唯一相似之處在於它們都採用了隨機生成數字這一點。然而其目的卻大相徑庭。

2.在心理學眾多領域里，大二學生問題不構成一個問題，因為所研究的心理過程是非常基本的過程（例如視覺系統），幾乎沒有人相信視覺系統的基本構造跟被試樣本的人口分布特徵有關。

這些應用所依靠的原理之所以能夠被準確地提煉出來，是因為在實驗室條件下，研究者們能夠精確地細化環境刺|激和行為之間的關係，而這一點在自然條件下是無法做到的，因為在自然情境下，許多行為之間的關係可能會同時起作用。至於非人類被試的使用，是因為在許多案例中，從動物的反應得出的理論和規律為我們提供了與人類行為非常相近的數據（Vazire & Gosling, 2003）。人類研究發現，人類的行為規律與從動物行為得出的規律非常相似。當人類疾病治疔方面的每一次醫學進步都源自動物研究數據的時候，這些發現也不應該再讓我們感到驚奇了。舉例來說，動物研究促進了很多領域的發展，包括行為醫學、壓力緩解、心理治療、受傷或者殘疾人士的康復、衰老對記憶力的影響、幫助人們克服神經性肌肉紊亂的方法、藥物對胎兒發育的影響、藥物濫用、失憶、交通安全、慢性疼痛的治療（Domjan & Purdy, 1995; Gosling，2001; Kalat, 1995; Miller, 1985b; Zimbardo, 2004）。最近，關於狗的研究為理解人類焦慮障礙的基本原理起到了實質性的推動作用（Groopman，1999）。

1.這種批評不能說明研究結果無效，只是需要更多的研究來證明理論的可推廣性。由於我們先前收集了大二學生的數據，即使從其他人群中獲得了相反的數據，從而必須對理論做出相應的調整，也只會使理論更加精確，而不會完全否定它。即使在比較極端的情況下，重複的實驗沒有得出相同的結果，我們也只能說，建立在大二學生數據基礎上的理論不夠全面，而不能說該理論一定是錯誤的。

羅伯特·克里斯和尼古拉斯·薩米奧斯（Robert Crease & Nicholas Samios, 1991）在一個處於領先地位的物理學研究中心——布魯克海文國家實驗室（Brookhaven National Laboratory）工作，他們在一篇論文中介紹了一些有關基礎研究擁有應用價值的例子。比如威爾赫姆·倫琴（Wilhelm Roentgen）的故事，他「發現了一件奇妙的事情，當他把焚光屏放在他的儀器附近時，熒光屏就會意外地發光；結果發現了自然界的一個新現象，他稱之為X射線。三個月之後，X射線已經被人們用來檢查骨折」（p九-九-藏-書.82）。再來看霍華德·弗洛瑞（Howard Florey），他和一個同事一起研究抗菌機制。「青霉素是他們所研究的微生物之一，這種微生物是幾年前才偶然發現的，但它的抗菌功能一直沒有被發現。現在的許多藥物都是在一些對應用沒有特別興趣的學術研究發現的基礎上研製出來的。」（p.82）

心理學家使用的許多技術在公眾看來是怪異的，很多人都不知道這些技術並非心理學領域所獨有，只不過心理學家把這些科學方法應用到人類行為的研究上而已。事實上，在每一個學科的調查研究中，都能看到人們用一些類似的怪異方式來獲取關於世界的知識。心理學家卻遭受了雙面夾擊。對科學方法的無知使得許多人相信心理學永遠不可能成為科學，於是，當心理學家像其他所有的科學家一樣創造必要的特殊條件來對心理現象進行更有力、更精確的解釋時，卻遭到了誹謗。

判斷和決策的心理研究已經應用於醫學、教育和經濟等領域的決策制定（Gigerenzer, 2002; Gilovich, Griffin, & Kahneman, 2002; Hilton, 2003; Kahneman, 2003; Kahneman & Tverslgr, 2000; Swets, Dawes, & Monahan, 2000; Tetlock, 2005; Zweig, 2001）。一項令人興奮的發展是認知心理學家更多地參与到法律體系中，這使得在信息搜集、證據評估和做出判決等方面，給認知理論的應用帶來了大量機會（Kassin，Tubb，Hosch, & Memorx，2001; Koehler, 1993; Kuhn, Weinstock, & Flaton, 1994; Redding, 1998; Wrightsman, 1999; Zimbardo, 2004）。而且從20世紀80年代中期開始，閱讀教學中的理論和實踐開始受到認知心理學的影響（Rayner, Foorman, Perfetti, Pesetsky, & Seidenberg, 2001, 2002; Snowling & Hulme, 2005; Stanovich, 2000; Veilutino, Fletcher, Snowling, & Scanlon, 2004）。此外有關兒童在法律程序中提供的證詞（Ceci & Hembrooke, 1998）和受虐兒童所「恢復」的記憶是否準確（Brainerd & Reyna，2005; Bremner, Shobe, & Kihlstrom, 200; Clancy, Schacter, Mc Nally, & Pitman, 2000; Gardner, 2006; Loftus, 1997; Lynn, Loftus, Lilienfeld, & Lock, 2003; Mc Nally, 2003; Pezdek & Banks, 1996; Spanos, 1996）等這些公眾爭論不休的問題方面，心理學家都提供了重要的科學依據。美國心理學會開設了一個網站：www.psychologymatters.org。你可以在此網站上看到更多有關心理學知識的實踐性應用。

但只要想一下其他科學的情況，就很容易理解這種想法的荒謬。化學家從沒嘗試過抽取化合物的隨機樣本，生物學家也不曾用細胞或組織的隨機樣本進行實驗。用於醫學研究的老鼠和猴子也不能完全代表其物種。而這些研究都是在與這些動物生活的自然環境完全不同的實驗室中進行的。事實上，這些條件通常很獨特。然而，所有這些研究得到的結果都可以幫助我們理解人體生物學。大部分心理學研究也是同樣的道理。並非每一個心理學調査研究都需要使用隨機樣本。因此，我們在此需要強調的重點是：隨機取樣和隨機分配（見第6章）不是一回事。

所有學科都假設某些因素對最終的結果沒有影響。生物學家一般不擔心培養皿厚度的細微差異會顯著影響裏面的細菌。當然，這些差異可能會產生影響——每一種科學假設都不是絕對的——但是生物學家必須把精力放在他們認為更有可能產生影響的變數上面。與此相似，海奇特假設暗適應跟人的宗教無關，因此他不問被試是路德教派的，還是羅馬天主教的。

前兩章講述了實驗邏輯的原則，現在我們可以思考一下心理學經常面對的一些批評。比如很多人認為科學實驗沒有價值，因為它是人為發生的，和「真實的生活」不一樣。我們將對這一觀點進行詳細探討。由於心理學實驗常常遭到類似的批評，因此理解這種批評的不合理之處，將有助於我們更好地了解心理學。

這種現象叫做暗適應，它會經歷兩個階段：首先是在進入一間漆黑的屋子時，視敏度迅速小幅度地升高，之後緩慢大幅度升高。海奇特把兩部分的升高曲線和視網膜上的兩種感光細胞聯繫起來。密集分佈在中央窩中心（視網膜的一部分，用於聚光）的視錐細胞，對紅光非常敏感。分佈在中央窩外圍的視桿細胞，沒有那麼密集，而且對紅光不是很敏感。海奇特根據這些事實建立了一個理論，即暗適應的最初階段（視敏度小幅地快速升高）源於視錐細胞的適應，第二階段（在更長的一段時間內視敏度大幅升高）源於視桿細胞的適應。

許多發展過程的研究都是以北美兒童為被試進行的，為了評估這些研究結果的可推廣性，發展心理學家也進行跨文化的研究。例如，史蒂文森等人（Stevenson et al., 1985）讓中國、日本和美國孩子完成大量的認知任務，然後得出結論，「三種文化下的兒童在這些任務中所表現出的認知能力非常相似」（p.727〉。其他認知能力的跨種族和跨文化比較研究也證實了相同的結果（Demetriouetal., 2005; Mc Bride-Chang & Kail, 2002）。對於其他心理學特徵，跨文化研究里有許多例子也顯示了相似的趨勢（例如，Day & Rounds, 1998; Rozin, Lowery, Imaｈｔtｐｓ://rｅａｄ•９9ｃsw.ｃｏmda, 1999）。但是，也有不少跨文化研究沒有得出與美國大二學生相似的結果（例如，Nisbett, 2003）。但是當出現這些差異時，這些研究仍然提供了一些重要信息，讓人們了解到這些理論和結果會因文化和背景的不同而不同（Chang, 1996; Menrichetal., 2004; Medin & Atran, 2004; Nishett, 2003; Yates, Lee, & Shinotswka, 1996）。

隨機分配和隨機樣本的區別

然而，不承認大二學生問題在心理學研究的某些領域里的確是個問題，這也是不明智的（Peterson，2001）。儘管如此，心理學家正在儘力矯正這個問題。例如，發展心理學家幾乎都很關注這個問題。這一領域中每年都有成百上千的研究人員，將眾多用大學生被試得出的理論和發現，在其他不同年齡的被試身上重新驗證。

理論研究和應用硏究的異同

例如，幾年以前，萊昂納德·伯克維茨（Leonard Berkowitz），威斯康辛大學的一名心理學家證明了所謂的「武器效應」——如果一件武器出現在手邊，會使得某個人更容易做出攻擊性反應。這個發現源於實驗室，是一個無代表性情境的典型例子。由於這一結果是人為情境的誘導產物，因此常被強烈地批評其具有誤導性。但事實是這樣的，各種實驗條件下得出的結果都一樣，用不同的方法測量攻擊性所得的結果一樣，在歐洲和美國獲得的結果一樣，研究兒童和成人的結果一樣，在實驗室之外的現場研究中，被試不知道自己是在參与實驗，得出的結果也一樣（Berkowitz & Dormerstrein, 1982; Turner, Simons, Berkowitz, & Frodi, 1977）。研究人員甚至提取出了武器效應背後的認知機制。在語義記憶中，它是一個自動啟動的過程（見Anderson, Benjamin, & Bartholow, 1998）。這個效應是如此之強，以至於安德森等人（Anderson et al., 1998）把文章題目定為「是手槍自己扣動扳機的嗎？」

用不同年齡組的人做被試並不總是能重複用大學生被試得出的結果。要是那樣的話，發展心理學就會變得很無聊了。但是一大堆心理學家都致力於在心理學理論中建立一個年齡因素，以證明這個因素的重要性，這一領域的研究也確保了心理學的宏大理論不是只建立在從大學生那裡收集的有限數據基礎之上。

對於這一點，我們必須承認以往的記錄是參差不齊的。但也必須清楚地意識到，這與心理學的多樣性|息息相關。一些領域中的研究確實在應用方面進展甚微，然而，其他一些領域則已經取得了十分矚目的成績，通過實驗已經推導出了許多具有解釋能力以及預測效力的原理（見Buss, 2003; Byrnes, 2001; Davidson & Sternberg, 2003; Gazzaniga, 2004; Hilton, 2003; Sunstein, 2002; Wilson & Keil, 1999; Zimbardo, 2004）。例如，在諮詢、教育、臨床、心理治療等應用領域，理論導向的基礎研究結果也獲得了大量實際應用（Davidow & Levinson, 1993; Garb & Schramke, 1996; Lilienfeld, Lynn, & Lohr, 2003; Lilienfeld, Wood, & Garb, 2000; Mahrer, 2000; Siegert & Ward, 2002）。

這些例子說明，心理學研究結果的穩定性和普遍性程度經常被低估了（Cheng, 2001; Gage, 1996; Rosenthal, 1990）。安德森、林德西和布希曼（Anderson, Lindsay, & Bushman, 1999）對實驗室研究和現場研究的效果進行了系統檢驗。從驗證攻擊性、領導力、抑鬱症等多種主題的研究中，安德森等人（1999）發現了高度的聚合性——幾乎所有不同的研究環境總是產生相似的結果。

「大二學生」問題

弗吉尼亞大學心理學家道格拉斯·穆克（Douglas Mook）闡述了不同類型的研究要求的不同類型的預測。許多應用研究的目的是把研究結果直接與生活中的特殊情境聯繫起來。對應用研究而言，預測必須是：研究與現實生活有「一對一」，亦即穆克稱作「類比」的關係，應用研究的結果必須都能直接應用。選舉投票中的民意測驗就是應用研究的一個例子。研究目的是預測一個特定情境下的特定行為，在這個例子中，就是選舉日的投票結果。由於研究結果是要直接應用於現實的，因此，樣本的隨機性和情境的代表性問題很重要。

心理學理論的應用

本章提到了幾個焦點問題，此外有一點很重要，就是我們應該清楚什麼是我們說過的，什麼是我們沒說的。我們證明了對心理學研究的頻繁抱怨源自一個基本的誤解，不是針對心理學，而且針對涉及所有科學的一個基本原則。我們看到人們質疑心理學家為什麼不在所有研究中都使用隨機樣本，並且解釋了這種擔心是多餘的。最後，我們看到，大二學生問題本來是一種合理的關注，但它有時被誇大了，尤其是當人們對心理學研究的廣泛性和多樣性不太熟悉時（見第1章）。

道格拉斯·穆克（Douglas Mock, 1983）就一個例子闡述了心理學中通過實驗來驗證理論的觀點以及間接應用的性質。20世紀30年代，塞里格·海奇特（SeligHecht）在《普通實驗心理學手冊》（Handbook of General Experimental Psychology）（Murchison, 1934）里發表了一系列有關視覺敏感度的研究，談到了暗適應的現象。你可能有過暫時性「失明」的經歷，比如當你走進一個漆黑的電影院時。但是，當你在位置上坐了一會兒之後，應九九藏書該就能注意到椅子、人以及其他物體慢慢變得可以看見。如果你繼續關注這個現象，你會發現視敏度不斷升高的這個過程會持續幾分鐘之久。

簡言之，我們必須意識到，雖然一些研究是為了直接預測某一特殊情境而設計的，但大多數科學研究仍然是用於驗證理論的基礎研究。怎樣把研究結果應用到現實生活中呢？從事應用研究和從事基礎研究的研究者們對此有不同的回答。前者會這樣回答：「直接應用，只要實驗情境和將來要應用的情境有相當程度的相似性就可以了。」因此，被試的隨機取樣和實驗情境的代表性都會影響結果的應用。然而，進行理論檢驗的研究人員是這樣認為的：研究結果不會直接應用於現實生活，進行理論研究的目的也不是為了將結果用於具體的環境條件。因此，這類科學家並不關心研究的被試與其他群體有多相似，也不關心實驗情境是否反映出某些真實生活的環境。那麼，這是否意味著這些研究結果對現實世界沒有意義呢？不是的。這些研究結果不直接應用於某一特殊情境，而是應用於理論。這種理論，也許在將來的某一天，可以和其他科學規律相結合，共同解決某一特殊問題。

一旦我們明白了大部分研究的目的是發展理論而不是預測具體環境下的事件，以及大部分研究的結果是通過理論間接應用的，而非在具體環境條件下直接應用，那麼我們就會順理成章地發問：究竟心理學中有多少理論可以在現實中得到應用。也就是說，心理學理論的普遍性得到驗證了沒有？

海奇特的研究發現之所以具有普遍性，並不是因為他的實驗情境的性質是人工的或是自然的，而是因為根據這些研究結果可以建立一個有關基本視覺過程的理論，而這個理論可以與許多視覺現象相關聯。他的研究揭示了人類視覺系統中各個部分之間的功能關係，而這恰恰是因為他的研究情境經過了人為的精確控制。如果這一理論模型是正確的，那麼它應該能廣泛地應用於各種情境，可以用來解釋許多行為現象，即使所處的情境與發現這一理論的情境完全不同。換句話說，海奇特的研究結果通過對理論的影響而產生了間接的應用價值。例如，海奇特的研究結果促進了對夜盲症的治療，改善了X射線的識別問題（Leibowitz, 1996; Mook, 1982）。更引人注目的是，二戰期間，英國飛行員在閃電戰中等待希特勒轟炸機的夜間襲擊時，戴上了紅色的飛行眼鏡（因為視桿細胞對紅光不夠敏感，可以保持暗適應；見Mook, 1982）。從在實驗室里判斷小紅點到辨別倫敦上空危險物體的移動，這一鴻溝是由理論跨越的，而不是通過把海奇特的實驗室改造成噴氣式戰鬥機得出的。

在心理學的一些領域里，這種將理論間接應用於現實生活的研究十分常見。例如，許多年前手機剛剛面世，許多認知心理學家立即開始擔心安全問題——人們邊開車邊接聽手機怎麼辦。心理學家立即預測手機的使用可能會導致交通事故增多——不僅僅是因為接聽電話的時候一隻手會離開方向盤，此外，他們還擔心接聽電話會轉移司機的注意力。有一點很重要，我們應該意識到，心理學家提出這些擔憂遠遠早於真正用行動電話來做的實驗研究（見Strayer & Johnston，2001）。心理學家通過理論預測手機事故問題，而這個例子中的注意力有限加工理論早在幾十年前就已經存在了（如，Broadbent, 1958; Kahneman, 1973）。這一信息加工理論是通過大量的實驗驗證（上百個實驗室研究）建立起來的，開車使用手機提供了一個機會，正好可以用這一理論來預測其可能造成的危害。事實也是如此，後來使用行動電話進行研究，結果證實了心理學中注意理論的預測：行動電話的使用確實是引發交通事故的一個原因（Insurance Institute for Highway Safety, 2005; Mc Evoyetal., 2005; Redelmeier & Tibshirani, 1997, 2001）。

主要目的為理論驗證的研究通常被稱為「基礎研究」。應用研究的目的是把數據直接應用於現實生活，但是基礎研究則專註于理論驗證。然而，僅僅根據某項研究是否有實踐性應用來區分基礎研究和應用研究，很可能會產生錯誤，因為這一差別常常會隨著時間的增長而逐漸消失。應用研究的結果會很快得到應用。但是沒有什麼能比普遍的、準確的理論更具有實用性了。儘管很多科學家進行理論或實證研究的初衷並非解決具體的實踐性問題，但他們發展出的科學理論或研究結果最終都解決了現實世界的許多問題。這樣的例子在科學史上不勝枚舉。

從第6章的內容中，我們已經可以清楚地看到為什麼這種批評是不合理的。正如上一章所述，科學實驗的人為性並不是一種缺點，事實上，正是它使得科學方法具備了一種奇特的力量，可以讓我們對世界進行解釋。與人們通常所相信的觀點不同，科學實驗的人為性並不是偶然的疏忽，而是科學家故意為之。科學家之所以專門設置一些非自然發生的條件，是因為只有這樣才可以將決定事件發生的許多相關變數區分開來。有時候，必要條件已經在自然狀態中存在，比如斯諾和霍亂病的例子。但這種情況並不經常出現。科學家必須用新異的甚至有時比較奇怪的方法操控事件，比如戈德伯格和糙皮病的例子。很多時候，這些操作無法在自然環境中完成，於是科學家必須把所要研究的現象轉移到實驗室中，以便實施更精確的控制。例如在有關「重力和運動」的早期研究中，使用了一些特製的物體，其目的就是為了創造一些特殊條件，以便觀察物體運動。因此，為了分析一種現象，經常需要創設非自然的極端條件。

事實上，「這不是真實的生活」的批評被錯誤地用來詆毀動物研究的成果——這種做法經常是由於政治的緣故。例如，那些為重度污染企業效勞的政客們總是否認致癌因素風險評估報告的有效性，他們的理由是，這些報告是以動物研究為基礎的，不能應用到人類風險評估上。然而，一組科學家在1988年進行的一個對23種致癌物質（苯、石棉，等等）的研究中發現，由動物研究計算出來的死亡率與由人類流行病學研究計算的結果非常相近（Rnkel, 1996）。