任賾: 人類在變得更聰明嗎? ——淺談弗林效應:智力提高的長期趨勢
問題的提出
當代人類是不是在變得更聰明?如果以智商測試分數(IQ分)作為「聰明」即智力的度量,那麼答案是肯定的。自從有IQ測試以來,一百多年中,一代一代測試人的IQ平均分在持續地提高。世界範圍內,從1909年到2013年,IQ的平均分每十年增加3分。標準IQ測試的平均分是100,30分的增長意味著從「智力中常」到「智力高超」的變化。因此可以說,人類智力不僅在提高,而且提高很快。
紐西蘭學者弗林(James Flynn)1984年在一篇開創性論文中,指出美國IQ平均分在1932-1978期間有大幅度提高,由此開闢了一個新研究領域。其名稱叫作「弗林效應」,其內容是「IQ提高的長期趨勢」。一開始,學者們,包括弗林自己,都對這個現象感到疑惑。公認智力是高度遺傳性稟賦。從遺傳角度看,有些社會變動會導致群體的智力提高,例如「優生學」工程,讓聰明人比常人多生孩子,又如人們大批與遠處乃至外族人結婚(從而避免近親繁殖,增加混血優勢)。二者都需要一代一代長期持續才能有成效。但是二十世紀中並沒有大規模發生這樣的變動,時間也太短,因而弗林效應無法用遺傳變動來解釋。
對這個新課題隨後展開的研究,重點在兩個方面:確認「IQ提高的長期趨勢」的存在(結論是肯定的),尋求IQ提高的原因(已有基本共識)。這些研究產生了一些饒有興味的成果,涉及社會進步和人類提升的一些重要層面。本文試做簡略的考察。
如何測度智力?
IQ測試是一套題目,覆蓋了常識、理解、算術、類同、記憶、詞彙、圖像、積木、排列、拼圖、符號等領域。在制定標準化IQ測試時,首先由專家出題,再找出一組標準化代表性的測試人作題。然後,對他們的得分進行標準化處理,使得測試組得分的均值為100,均方差設為15(均方差是表明一組人群得分的散布程度的指標)。經過這種技術性的標準化處理,應試者得分就呈現如圖1的分佈。其中橫軸是IQ分,縱軸是對應一定分數的應試人數。熟悉統計學的讀者立即可以看出這是一個正態發布。
圖中IQ均值為100。有68.2%的人的分數落在100上下15分(一個均方差)的範圍,即(85-115)區間,這組人擁有平均智力。向右方(高分方向),有13.6%的人得分在(115-130)區間,稱作智力高於均值的人。得分高於130(兩個均方差之上)的人有2.2%,是智力高超的人。向左方(低分方向)的情況與右方對稱。
每年都有許多人參加IQ測試,參試者可以根據得分判斷自己的智力在人口總體中的位置:得110分?那是中常資質。得132分?那可是智力高超!比較一個參試者在數字、空間、邏輯、詞彙、創造、記憶等領域的得分與標準測試組的差異,還可以判斷這個參試者智力的相對強項和弱項。
專家們已經開發了不少標準化的IQ測試,普遍採用的有用於成人的WAIS測試(Wechsler Adult Intelligence Scale)和用於兒童的WISC測試(Wechsler Intelligence Scale for Children)。此外還有一些注重特定領域智力的測試,例如專測邏輯思考能力的Raven測試(下文將說明)。IQ測試廣泛用於徵兵、招工和其他場合的人才篩選中。
如何測度智力提高?
一套標準化IQ測試題,使用一段時間就要更新。例如,WISC測試最初是1949年開發的,後來在1974、1991、2003和2014 年更新。更新時,要找一組新的代表性測試者,參加新試題的考試,再對他們的得分作標準化處理。為了保證IQ試題的延續性,會讓新測試組去做以往的測試題。這恰恰成為檢驗IQ提高的一個方法。弗林最初就是根據1974年更新時測試組做1949年測試題的結果,發現IQ提高的現象。他說,實際作業中,每一次這樣的考試,新測試組去做老測試題的平均得分,都高於100。後來許多學者分析不同的IQ測試、不同地區、不同年代的資料,都看到同樣的結果。
可以參照圖2來直觀地理解弗林效應。圖中左邊的鍾形曲線是1932年測試組的得分情況,其均值為100,均方差為15。右邊的鍾形曲線是1997年的測試組去做1932年的測試題的情況,其得分曲線向右移動,其均值提高到120,而且,有超過20%的人得分高於130。按1932年標準,他們會被認為是智力高超者(如圖中右邊紫色區域所示)。學者就是在這個意義上說,後來的人變聰明了,智力提高了。
對弗林效應的大規模驗證
對弗林效應最大規模的經驗驗證,是2015年發表的Pietschnig & Voracek的研究,他們根據31個國家4百萬人參加的271個樣本,考察了1905-2013期間的IQ變動。這項研究成果可以用圖3來概括。
每一線條代表一個地區的IQ變動情況,為便於比較,每個地區最早測試的成績設定為0,因此每個線條就表示這個地區IQ在以後年代中的增值。例如,美洲在1909-2006期間IQ提高33分,亞洲在1950年以來的半個世紀中IQ提高35分。由於每個地區採用的IQ測試不同,測試開始的年代也不同,因此各條線之間的增長情況不可比。但是共同的趨勢是一目了然的:每條曲線都是上升的,而且是連續上升,沒有下降、波動。注意有些曲線的上升有趨緩跡象。
現在學界共識是,弗林效應已經在眾多紮實的數據分析得到確認:在每一個主要智力測試中,對每一個年齡組,在每一個智力水準上,在每一個發達國家(後來發現也在亞洲、非洲廣大地區),IQ得分都在上升。世界總體的情況,如圖中粗黑線所示,是一百年間IQ提高30分。
當然,在任何研究領域中學者永遠有不同看法,對弗林效應,仍然有學者就概念和數值測度提出質疑。近年來有報道,在某些北歐國家IQ在下降。本文簡介學界主流觀點。
哈佛教授平克(Steven Pinker),著名的認知心理學家和暢銷書作者,2018年2月出版了新著《Enlightenment Now》(中譯本《當下的啟蒙》,浙江人民出版社2018年12月)。主旨是:自啟蒙運動以來,人類社會一直在提升,推動力量是啟蒙運動倡導的四個觀念——理性、科學、人文主義、進步。書中分章列舉了一些最重要方面的進步:壽命、健康、食物攝取和營養、財富、分配不均、環境、和平、安全保障、民主、平等權利、知識、生活質量、幸福,等等。全書以詳實的數據展示了一幅樂觀向上的圖景。這些進步是在經歷了兩次世界大戰、冷戰和各種天災人禍的條件下取得的。書中在「知識」一章中簡述IQ提高問題。這種全景視角有助於理解弗林效應——它是更大範圍的進步的一部分。現在按照這個思路,來考察促進IQ提高的因素。
解釋IQ提高:脫貧的成果
本文開始時提到學者對智力提高現象的困惑:智力是高度依賴遺傳的稟賦,但沒有資料表明弗林效應可以用遺傳因素解釋。另一方面,經濟學中有許多實證研究表明,在許多國家經濟增長過程中,一些同樣被認為是高度依賴遺傳的稟賦,例如身高、壽命,都有顯著提高。促進身高、壽命提高的因素,包括消除飢餓、增加營養、減少疾病、改善健康等等。
沿著這個路徑作研究,證實這些因素也促進IQ提高。這個結論易於理解。大腦這個精細的器官需要大量營養和能量,它主要由脂肪和蛋白質構成,日常消耗人體五分之一的能量。營養不良會影響大腦發育。一些疾病會影響大腦正常功能。身體健康、新陳代謝旺盛可以讓大腦活躍敏銳。
改善健康、營養等因素促進IQ提高,這是經濟增長的偉大貢獻。但它們只能部分地解釋弗林效應。原因是,它們的作用主要落實在IQ曲線的左半邊,即智力偏低的人群。社會經濟統計顯示,低智商通常與食物短缺、健康欠佳、營養不良等指標相關,營養、健康方面的改善導致這些人的IQ提高。反之,高智商的人一開始就比較富裕,有相對良好的營養和健康,對他們,這些因素的促進作用就比較弱。研究確實發現,在一定時期、一定地區,弗林效應主要集中在IQ曲線左端,把原來智力不高的人們提升到平均水平。但是,這種作用有其限度(超過一定水平后,更多食物、營養就使人發胖而不是變聰明),也不能解釋大量資料顯示的人口總體的整條IQ曲線向右移動的現象。
解釋IQ提高:教育(常識和基本技能)的推動
要解釋IQ的整體提高,學者們首先提出並確認的因素是教育——正規入學受教(formal schooling)。教育使兒童增加詞彙量、提高語言和算術能力、擴展知識,這些都在IQ測試考題的範圍內。在世界各國經濟發展過程中,隨著義務教育、男女平權等法案的實施,教育逐漸普及(更多兒童上學)、普遍(男女兒童都上學)、延伸(從小學、初中、高中到大學)。在經驗研究、統計分析中,反映「教育」這個因素的最常用指標是「在校受教年數(years of schooling)」。大量的研究表明,「在校受教年數」的增長對IQ提高有重大的推動作用。弗林認為它是IQ提高的第一位因素。
一些國家15-64歲人口計平均在校受教年數(初、中、高等教育合計)。美國的曲線高居其他國家之上,因為美國實施義務教育領先世界。1852年從馬薩諸塞州開始,1900年擴展到31個州,1918年所有州都要求學童完成小學義務(免費)教育,後來延伸到高中義務教育。在校受教年數從1870年4年增到2010年超過12年。普及教育提高人口素質,積累人力資本,從十九世紀晚期起,是美國經濟起飛、高速增長、超越英法的重要推動力量。現代發達國家基本上普及了高中教育(12年)。中國的曲線自1940年開始上升,目前略超8年,差距是明顯的。在校受教年數指標不能反映美國中小學教育現在存在的問題,這裏不討論。
需要指出,教育對IQ的促進作用並非單純通過增加「在校受教年數」而體現,極其重要的是所教的內容。歷史上,西班牙曾經是環球航海、地理大發現時代的強國,但後來直到二十世紀中,它的經濟在西方國家中總是處於滯后地位。西班牙的「在校受教年數」指標數值其實很高,但它的教育系統一直處於天主教教會控制之下。平民兒童在學校里只接受到關於聖經、教義問答和一些簡單技能的口頭教學。教會認為,對訓練有素的神學士以外的任何人,科學、數學、政治經濟學和塵世歷史都是太具爭議性的內容。現代阿拉伯世界的經濟落後,也同樣歸因於教士實行的思想禁錮。IQ的提高,主要依賴另外一種教育。
解釋IQ提高:細看不同範疇的增量
在這方面的追溯研究成果豐富,進一步揭示了究竟在哪些領域的哪些因素,有效地促進了IQ的提高。一個代表性成果是弗林在2007年出版的《什麼是智力(What is Intelligence)?》一書。他根據美國兒童的WISC測試結果,分析了在各種智力範疇中IQ分數的增量。結果發現,只有一小部分IQ提高是在學校直接教授的知識領域(常識、詞彙量、算術等),而大部分IQ提高發生在抽象思維、邏輯推理領域(諸如類同性試題、Raven測試等)。
這方面的研究成果可以用圖5概括。該圖顯示在1940-2010期間,IQ總分以及一些特定領域的智力測試分數的增長情況。可以看到,IQ提高中,增量最少的是常識、算術、詞彙(主要通過學校教育提高的能力),這就是圖中最下面的一條線。其上方,進步快、增量大的幾條線,從下到上,依次是理解力、操作能力、IQ總分、類同性判斷、Raven測試等涉及邏輯推理的能力。
對這裏談到的智力測試作簡要解釋。一般把智力分成言語能力與操作能力兩大類。操作能力測試有五種:完成圖像,排列圖像,設計積木,數碼符號,組裝部件。當代父母經常欣喜地看到自己的孩子在玩拼圖、積木時展現出來的聰明才智,就是這種智力。
Raven測試考的是邏輯推理能力,圖6給出一個例子。圖中有三橫行,每行三圖,上兩行中,從左到右三圖中黑色小塊在順時針旋轉,這是給定的邏輯序列。因此第三行中的第三圖的答案,應該遵循同樣方式確定。Raven測試完全脫離具體現實世界,只涉及抽象圖形,不依賴具體知識。測試者必須能夠理解用抽象符號表現的邏輯關係,並做出正確的推理。
舉幾個例子說明抽象思維、邏輯判斷測試題。類同性(similarity):「『小時』和『年』有什麼共同性?」(答案:都是時間單位)。類比性(analogies):「如果『鳥』與『蛋』相聯繫,那麼『樹』與什麼相聯繫?」(答案:種子)。邏輯推理:「假定在國家A任何東西都用塑料製造,那麼,那裡的烤箱是塑料做的嗎?」
最後這個邏輯題看起來再簡單不過,卻有著顯赫的歷史。典故是:1930年代,著名心理學Luria在俄國(當時是蘇聯)邊遠鄉村做調研,他記錄了與一個農民的如下對話。
問:在常年下雪的地方熊都是白的;國家A常年下雪;在國家A,熊是什麼顏色?
答:我只見過黑熊,我不談我沒有見過的東西。
問:但是我的話語包含了什麼結論?
答:要是一個人從來沒有到過那裡,他就不能根據某些話語說出任何意見。
這成為認知心理學的一個經典例子,上述烤箱問題就是它的一個現代版本。Luria還記錄了以下問答。問:「狗與兔子有什麼共同點?」答:「人們用狗抓兔子」。在IQ測試中這本來是一個歸類問題,需要的智力是把具體事物放進抽象範疇中,因此要說「它們都是哺乳動物」這樣的答案才對。確實,不能超越自己經驗範圍的事物而作抽象的理性判斷,不能應對假設的問題,是智力短缺的表現。弗林認為,在抽象思維領域的進步,是促進IQ提高的第二大因素。
解釋IQ提高:教育(分析性思維方式)與環境提升
很自然,接下來的問題是:在抽象思維、邏輯判斷領域,又是什麼促成了人們能力的提高呢?研究表明,有教育和環境兩大類因素。此處說的教育,是指其內涵,涉及教學原則、內容和方法,並非「在校受教年數」指標所能涵蓋。這種教育建立在開明的理念上:自然科學理論是可以證偽的假說(因為沒有被證偽而保留下來),人文社會學科知識要在獨立思考、質疑、辯駁、分析中領會(沒有強加的不容置疑的思想禁區)。因此,強調開放、理性、啟發,鼓勵挑戰性思維、爭辯式討論。實際上,小學、中學未必開設邏輯課,但只要教學過程的重點在理解和推理,而不是灌輸和背誦,就可以培育「分析性思維方式(analytic mindset)」。上述那些IQ邏輯試題,考的正是這方面的能力。很多學者還指出,美歐國家現代教育中的考試,不以背誦知識為重,而以理解、分析、推理為主,實際上幫助了學生熟悉IQ測試題,從而提高IQ分數。
環境類的因素有很多。總起來說,現代世界充滿了抽象的符號和概念,例如,地鐵、機場的符號指示牌,孩子玩的電子遊戲機的鍵盤、屏幕,成人用的計算機中的軟體應用,電視新聞中常見的圖表和常說的概念術語,等等。因此人們日漸熟悉越來越多的視覺符號,越來越習慣對符號概念作判斷思考。當初人類老祖宗在叢林環境依靠羚羊般的本能反應能力躲避危險,一有異常的聲光信號,不假思索拔腿就跑,因為樹叢後面可能竄出狼或虎;他們也在捕獵中發展了分析判斷動物種類和行蹤的理性認知能力。在後來的文明進化中,人類逐漸發展了語言、算術、常識等方面的智力。現代人身處數碼技術的環境中,就像是時刻處於邏輯鏈條的節點,需要對(以符號表示的)事件作是、否、和、或(YES/NO/AND/OR)等判斷,再採取下一步行動。這樣的環境,當然導致智力測試中抽象思維、邏輯判斷領域分數的提高。弗林認為,現代世界中無處不在的視覺符號,是促進IQ提高的第三個因素。
就適應環境而言,現代人適應當代世界,和採獵時代、農耕時代的前輩適應當時的世界,程度未必有多大差異。經濟、技術、社會進步帶來了更複雜的世界,人們的應對能力也就相應改進。這就是說,人類自己創造了新環境,又在適應新環境的過程中提高了自己的智力。
結語
現在來總結一下關於智力提高的研究成果。弗林效應,即「IQ提高的長期趨勢」,已經被大量研究確認。促進IQ提高的因素包括生理體質和社會環境兩方面,公認最重要的是營養、健康、教育和環境提升。教育這個因素中,在校受教年數的增長是重要的,教學內容和方式的貢獻在晚近更加突出。歷史經驗表明,以定於一尊的教義禁錮思想的教育,以背誦、應試為核心的教育,都與提高智力相悖。現代環境激發了人們在抽象思維、邏輯推理領域的智力快速提高。
值得在最後提及智力提高對社會和個人的影響。與「什麼因素促進IQ提高?」反向的因果鏈條是「IQ提高,影響了那些事物?」這方面的基本問題是:IQ提高是否促進了經濟增長?是否促進了個人福利?研究提供了肯定的答案。就全社會看,IQ提高可以促進人均GDP增長速度,改善壽命、閑暇時間等福利指標的提升。從個人角度看,IQ提高有助於健康、長壽、職場成功、財富積累(但未必增進幸福)等等。這些研究成果符合人們基於常識的預期,同時,為IQ提高涉及有關因果因素提供了正反饋或者說良性循環的圖景。
近幾十年來,在世界範圍興起的原教旨主義、恐怖主義、民粹主義的逆流,其中一個重要組成部分是反智主義。平克《當下的啟蒙》一書展示,從啟蒙運動以來人類發展的主流,是理性、科學、人文主義、進步。在新的一年開始的時候,回顧那個主流中的一個成就,人類智力的提高,給人以啟迪和希望。
文獻:
Steven Pinker, Enlightenment Now, The Case for Reason, Science, Humanism, and Progress, Viking, New York, 2018
[美]史蒂芬·平克,當下的啟蒙,浙江人民出版社·湛廬文化,2018年12月
Flynn, James R. (1984). 「The Mean IQ of Americans: Massive Gains 1932 to 1978」. Psychological Bulletin. 95: 29–51. doi:10.1037/0033-2909.95.1.29.
Flynn, James R. 「What is Intelligence?」, Cambridge University Press, 2007
Pietschnig & Voracek,One Century of Global IQ Gains: A Formal Meta-Analysis of the Flynn Effect (1909-2013),Perspect Psychol Sci. 2015 May;10(3):282-306.
- 🔥免費PC翻牆、安卓VPN翻牆APP
- 🔥靈魂之謎|中華文化|治國大道
任賾
2019/1/8新年試筆
——《縱覽中國》首發 —— 轉載請註明出處


臉書專頁
粉絲交流群