最近,心理學史上的一個著名實驗——津巴多的「斯坦福監獄實驗」被質疑造假。類似的事情也不是第一次發生了,幾年前,另一個著名的實驗——棉花糖實驗也遭到了質疑。(棉花糖實驗的被試是上幼兒園的兒童,實驗者給他們每人一顆棉花糖,告訴他們,如果一段時間不把棉花糖吃掉,就能得到兩塊棉花糖。有些兒童拿到糖就直接吃掉了,有些能夠忍住不吃,最後得到了兩塊糖。幾十年後對這些被試進行回訪時,實驗者發現,那些能夠忍住不吃糖的兒童長大后比直接吃掉糖的兒童成功。這個實驗成為「情商」這個概念的來源。然而質疑者認為,實驗沒有很好地控制無關因素,直接吃掉棉花糖的兒童大多出身社會底層,父母也經常違背對兒童的承諾,因此這些兒童直接吃掉糖其實是適應環境的做法,長大后不如另一些兒童成功也是家庭出身導致的。)
在我看來這沒什麼奇怪的,網上流傳的那些吸引眼球的社會心理學實驗,絕大部分都不怎麼靠譜,就算不存在有意造假的問題,其可重複性和生態效度(實驗結果能否推廣到現實世界,解釋現實世界中的問題)也非常值得懷疑。我認為這可能是以下幾個原因造成的:
第一是統計學方面。心理學研究需要用到統計學,而統計學通常需要數據符合正態分佈。有些數據,比如人的身高體重等等,都是符合正態分佈的。然而在社會領域,許多數據其實是不符合正態分佈的。比如人的收入其實是負偏態分佈(所以「平均收入」的說法可能會造成一些誤導),人在社交網路上的好友數量是冪次分佈(大部分人的好友很少,少數人好友極多),等等。對於這些不符合正態分佈的數據,統計學就不太好用了,硬要用的話,出來的結果多半也不怎麼靠譜。
第二是抽樣方面。如果要做社會調查,如入戶調查、問卷調查等等,為了確保受訪者有代表性,我們通常需要用隨機抽樣的方法(有完全隨機抽樣和分層隨機抽樣等許多種方法)來選擇受訪者。(社會調查在中國遇到的困難包括研究者很難獲得中國的人口統計數據,以及由於人口流動等原因,隨機抽樣抽中的人在實際調查的時候不一定能找得到。因此中國的許多社會調查其實都是不合格的,比如在幾個大城市裡調查幾所大學的學生,就說是「中國青年政治態度調查」等等。)這種隨機抽樣成本相當高,因此在做心理學實驗的時候,不可能用社會調查的方法來選擇被試。心理學實驗的被試,基本都是大學生。有人吐槽說,心理學家只研究大二學生和白老鼠(心理學研究也會對被試的性別、年齡等進行匹配,但通常不會特意挑選各種各樣有代表性的人來當被試,這一點下文中還會提到)。心理學在這方面的假設是:人和人沒什麼區別,隨便研究一些人就能代表所有的人。這一假設在有些方面是合理的,比如,如果你要研究人的眼睛是怎樣看東西的,可能隨便找幾個視覺正常的人就行了,被試的社會階層經濟收入等等,大概都不會有什麼影響。但是社會心理學研究就不是這麼簡單了,不同國家、種族和社會階層的人在社會行為上可能有很大差異。美國心理學家喬納森·海特把那些西方國家的、受過教育的、生活在工業化社會中的、富裕的和生活在民主國家中的人群叫做「怪異」(WEIRD)人群,認為這些人在道德觀念上與世界上其他人有很大差異。絕大部分心理學實驗的被試,都是這些所謂的「怪異」人群,他們能否代表全人類,其實是很值得懷疑的。
第三是實驗假設方面。前面提到,心理學研究也會對被試的性別、年齡等等特徵進行匹配。這通常是為了把這些因素當作需要控制的無關變數,而不是作為研究者感興趣的自變數。為什麼呢?因為自變數通常需要是一個研究者能夠控制的變數,比如在實驗中,我們把被試隨機分為兩組,給其中一組被試看「醫生-護士」的單片語合,給另一組被試看「麵包-護士」的單片語合,測量兩組被試中哪一組的反應時比較短。這樣才能證明自變數和因變數之間有因果關係。而被試的特徵其實不是研究者能夠控制的變數(拿性別來說,一名被試或者是男的,或者是女的,或者是其他性別;研究者無法讓一名被試變成男的或者女的或者其他性別)。如果用被試的特徵(如性別)來做自變數,把被試分為兩組(一組男人、一組女人),實驗結果發現兩組被試之間確實存在差異,那麼我們能否得出結論說,這種差異是由性別導致的呢?這樣的結論恐怕會有循環論證之嫌。這樣的研究其實屬於相關性研究,無法得出因果結論來。(心理學家不喜歡相關性研究,因為相關性研究比實驗研究不靠譜得多,很多數字之間都會有莫名其妙的相關性,比如全球變暖與海盜活動減少也有負相關。)本文開頭提到的棉花糖實驗,其實也有這個問題:兒童能否忍住不吃糖,是兒童本身的特質,並不是實驗者操縱的結果。
這就造成了一個結果:社會心理學實驗只能研究情境因素對人的影響,而無法得出任何結論說某種現象是由被試的「天性」或「特質」導致的。而既然一切都是由情境決定的,那麼心理學實驗室中的情境與現實世界其實有很大差異,因此研究結果能否推廣到現實世界,解釋現實世界中的問題,也就是很成問題的了。甚至有研究認為,人在特殊情境下會做出什麼樣的反應,與任何社會結構因素,如被試的階級、教育、宗教和政治信仰,以及該人平時的表現都無關。有研究者對和斯坦福監獄實驗相似的米爾格拉姆「服從權威實驗」(實驗者讓被試充當「老師」,命令被試對犯錯的「學生」施加強度越來越高的電擊,觀察有多少人服從命令把電擊進行到底)的被試進行回訪時,也發現了類似的問題:有些服從命令把電擊進行到底的被試後來參加了反越戰運動,有些反抗實驗者的被試反而十足權威主義人格。
最後一個問題涉及怎樣對待實驗結果。好多人都嘲笑某些研究得出來的結論類似「自殺有害健康」或者「東西便宜了人就會多買」之類。其實研究得出這些結論不能算什麼壞事——你要是研究出來個結論說自殺有益健康,那才真叫人頭疼呢!我上大學的時候,有一次聽某學者的講座,講座完了有學生提問:如果研究結果與自己的直覺相悖,你是相信哪個?該學者毫不猶豫地說相信自己的直覺。這或許可以說明,某些領域的研究並不比直覺更靠譜。另一方面,如果大家都像他這麼想的話,與直覺相悖的研究結果可能就永遠不會發表出來。社會心理學研究方面還有一個問題,那就是,像津巴多的斯坦福監獄實驗和米爾格拉姆的服從權威實驗這類吸引眼球的實驗,一旦經過媒體廣泛報道之後,實驗結果就再也不可重複了——大家都知道在此類實驗中應該怎樣表現,以免遭受道德壓力了。所以此類實驗的可重複性都很差,但這並不一定說明實驗本身有問題。
說了這麼多,有人可能要問了:如果存在這麼多問題的話,那麼心理學還有什麼用呢?呃,第一,你要學習了心理學,才能知道這些實驗在哪些地方有問題啊。心理學最大的用處,大概就是能教會人批判性思維了。有研究指出,學習心理學之類社會科學的學生,批判性思維能力比學習人文、藝術、工程甚至自然科學的學生都要強。至於這個研究靠不靠譜,就由你自己來判斷了。
第二,關於這些實驗本身:我認為這些實驗雖然存在各種問題,但還是有價值的。它們的價值並不在於得出結論,而在於充當丹尼爾·丹內特所說的「直覺泵」,啟發我們的思維,給我們提供進一步研究的思路。
(文章只代表特約評論員個人的立場和觀點)
來源:RFA, 文章內容並不代表本網立場和觀點。