OMG這是心理學

誠實是美德?但《金錢心理學》作者,卻深陷捏造假數據的風波

你一定聽過《金錢心理學》、《不理性的力量》等多本行為經濟學科普書籍。然而,在台灣蠻知名的作者丹艾瑞利(Dan Ariely),現在卻深陷捏造論文數據的風波中,到底論文數據出了什麼問題?

「如果你寫了一本關於《The Honest Truth About Dishonesty》(中譯本:誰說人是誠實的!)的書,那你最不想和捏造數據有掛鉤。」《經濟學人》報導寫道。

身為杜克大學行為經濟學家的丹艾瑞利,過去和其他四位學者合著的論文,被專作數據新聞媒體的 Data Colada 指出竄改數據,並指出丹艾瑞利就是參與該項研究數據工作的人,更要求撤回這篇論文。

消息一出,學界也開始質疑丹艾瑞利過去的相關研究。而這篇論文到底出了什麼問題?

2020 年重新複製原始論文,原始數據在這裡開始露餡

引起爭議的就是,他在2012年所發表的論文< Signing at the beginning makes ethics salient and decreases dishonest self-reports in comparison to signing at the end>。而且,這篇論文還刊載在知名《美國國家科學院院刊》(PNAS)上。

當時,更被認為是對人誠實研究的重要里程碑。畢竟人們常常在提供重要訊息時說謊,像是為了節稅而把收入寫更低等。

因此,當時他們經過研究後發現,如果讓人在填寫文件,一開始先簽名、再提供相關個人訊息的話,會比在提供個人訊息、最後文末簽名,人的行為就會變得更加誠實。

雖然聽起來好像有點道理,但卻帶有點荒謬感。我知道,但更奇妙的事情,還在後頭。這篇論文一發表後,各個政府單位都開始採用這種做法。

時間快轉到 2020 年,哈佛大學團隊和原先五位學者,一起重新複製原始論文的研究<Signing at the Beginning vs at the End Does Not Decrease Dishonesty>。結果,他們發現事先簽名對人會表現得更誠實,並沒有影響。

論文數據爭議的開端,得從原始論文中的研究3說起。有別於論文其他研究是在實驗室進行,這也是多數研究者所參與的部分。引發爭議的研究,就是從美國一家汽車保險公司在丹艾瑞利監督下所進行的現場實驗。

為了更清楚研究人在一開始,還是在文末簽署自己名字,哪種情況會更誠實。因此,他們隨機分派保險公司的客戶到兩組,並要求他們填寫汽車當前里程數。

當時論文的結果發現,被分到一開始就先簽名的組,所報告比最後才簽名的組整整多出 2400 英里。這個數值比另一組列出的里程,增加了10%。因此這裡被研究者推論為人表現得更加誠實,相應地會要繳更多保費。

但是,在 2020 年的論文中,雖然沒有重新複製這項實驗,但是他們也發現這項數據很奇怪。因為這個差異變得太小了吧!即便在不同條件下的里程數,依舊存在極大的差異。在最新論文中作者推測,可能在原始研究中隨機分配不夠好,或者可能沒有按照指示進行。

論文數據都太過於完美了吧?Data Colada提出三大質疑

Data Colada就指出這篇研究中,最有問題的三個地方。

首先,照理來說汽車的里程數,應該呈現常態分配。就像大多數真實數據一樣,在群體內有部分超常或超少開車的人,多數人是落在中間值。但是在原始論文中的分配,呈現的卻像是一個直方圖。

也就是說,開了40000英里的人數和開了20000英里的人數是相同的,而駕駛 1000英里和開了500英里的人數也一樣多。詭異的是,所有里程數的數據都不超過50000英里。

可以看見這份數據呈現直方圖,且幾乎不會超過50000英里。取自Data Colada。

第二個問題,則是這些里程數都太過於精確了。當要人自己寫下里程數,通常都會四捨五入。但是在其中一項實驗數據中,所有的里程數都沒有四捨五入。而通常隨機數生成器是無法做到四捨五入,所以這也讓Data Colada懷疑兩份數據不一致的原因。

左圖為多數人會採取四捨五入後的數據做為里程表,但右圖明顯沒有四捨五入。取自Data Colada。

最後,他們發現研究所蒐集的數據中,使用到字體 Calibri 和 Cambria 的,基本上兩者在里程數上的差距極小。也就是說,只要用到字體Cambria的那筆資料,就會產生一筆與它相似的字體Calibri的資料。這也就代表為了掩蓋複製真實數據,因此研究者添加一些隨機變化,讓數據看起來更真實。

其實可以看到兩種不同字體,但數據上卻只有極小的差距。取自Data Colada。

對此,論文作者群都表示他們是被欺騙,而並非不誠實。其中一種可能的解釋是,保險公司的員工捏造了這些數字。但是保險公司 Hartford 表示,相關資料是在2007–2008 年所進行的,目前已經無法找到任何數據。

「我沒有捏造數據,」丹艾瑞利說。甚至表示自己願意對此進行測謊測試。但是,這捏造數據消息一出,且Data Colada更提出多項質疑,大眾對於這位行為經濟學家的學術威望必定大打折扣。

參考資料

  • Shu, L. L., Mazar, N., Gino, F., Ariely, D., & Bazerman, M. H. (2012). Signing at the beginning makes ethics salient and decreases dishonest self-reports in comparison to signing at the end. PNAS Proceedings of the National Academy of Sciences of the United States of America, 109(38), 15197–15200.
  • Kristal, A. S., Whillans, A. V., Bazerman, M. H., Gino, F., Shu, L. L., Mazar, N., & Ariely, D. (2020). Signing at the beginning versus at the end does not decrease dishonesty. PNAS Proceedings of the National Academy of Sciences of the United States of America, 117(13), 7103–7107.