文章摘要
心理学领域在2010年代经历了一场重大危机,许多广泛接受的研究结果被发现不如之前认为的可靠,这被称为“复制危机”,因为全球实验室在尝试重复这些经典实验时未能成功。
文章总结
著名认知心理学实验的复制失败案例
在2010年代,心理学领域经历了一场重大危机,许多被广泛接受的研究结果被发现并不如之前认为的那样可靠。这场危机被称为“复制危机”,因为全球各地的实验室在尝试复制先前发表的实验结果时,大多以失败告终。换句话说,许多报告的心理学效应要么根本不存在,要么比最初声称的要弱得多,失去了其学术价值。
尽管这场危机也涉及其他领域,但本文主要关注心理学,尤其是认知心理学。虽然这些失败复制的案例已经是旧闻,但许多人仍然难以区分哪些研究结果可能是真实的,哪些是虚假的。本文旨在提供一个简洁的参考列表,列出那些未能复制的著名认知心理学实验,以便读者能够更好地理解这些研究的现状。
以下是一些未能复制的著名实验及其简要说明:
自我损耗效应
- 声称结果:人们有一个“意志力电池”,随着一天中自我控制的消耗,意志力会逐渐减弱。
- 复制状态:未能复制。
权力姿势效应
- 声称结果:采用扩张性姿势(如双手叉腰或双臂高举)两分钟可以增加睾酮、减少皮质醇,并让人感到更有力量,更愿意冒险。
- 复制状态:未能复制。
社会启动效应:老年词汇效应
- 声称结果:接触与老年相关的词汇后,人们走路速度会变慢。
- 复制状态:未能复制。
金钱启动效应
- 声称结果:仅仅思考金钱会让人变得更自私,更倾向于支持自由市场价值观。
- 复制状态:未能复制。
ESP预知效应
- 声称结果:在某些情况下,人们可以预测未来事件。
- 复制状态:未能复制。
清洁与道德效应
- 声称结果:清洁或思考清洁会让人在道德上更加宽松。
- 复制状态:未能复制。
葡萄糖与自我损耗效应
- 声称结果:补充葡萄糖可以“充电”意志力电池。
- 复制状态:未能复制。
饥饿与风险承担效应
- 声称结果:闻到新鲜烤饼干的香味会让人对风险不敏感,更愿意冒险获取食物。
- 复制状态:未能复制。
心理距离与解释水平理论
- 声称结果:心理距离较远的事件会被更抽象地处理,而心理距离较近的事件则会被更具体地处理。
- 复制状态:存在严重的可信度问题。
排卵与择偶偏好效应
- 声称结果:女性在排卵期更容易被有吸引力的男性吸引。
- 复制状态:未能复制。
棉花糖测试与长期成功效应
- 声称结果:4-5岁时能忍住不吃棉花糖的孩子在青少年时期表现更好。
- 复制状态:未能显著复制。
刻板印象威胁效应(女性数学表现)
- 声称结果:女性因担心被负面刻板印象影响,数学表现会下降。
- 复制状态:未能复制。
微笑感觉更好效应
- 声称结果:用牙齿咬住笔(强迫微笑)会让人们觉得卡通更有趣。
- 复制状态:未能复制。
偏见的客观测量
- 声称结果:通过回答某些问题的速度可以预测一个人是否种族歧视。
- 复制状态:证据混杂,效果微弱。
莫扎特效应
- 声称结果:听莫扎特的音乐能暂时提高智商。
- 复制状态:未能复制。
成长心态干预
- 声称结果:教导学生智力是可塑的,能显著提高学业表现。
- 复制状态:结果混杂,部分成功复制。
双语者更聪明
- 声称结果:双语者在注意力、任务切换和执行控制方面具有显著认知优势。
- 复制状态:未能复制。
这些案例提醒我们,科学研究的可复制性是验证其有效性的关键。尽管许多心理学研究结果仍然可靠,但复制危机提醒我们在接受新发现时应保持谨慎。
评论总结
心理学实验的可重复性问题
- 评论1指出,心理学各领域的实验重复率较低,社会心理学为37%,认知心理学为42%,人格心理学为55%,临床心理学为44%。
引用: "Approximate replication rates in psychology: social 37%, cognitive 42%, personality 55%, clinical 44%." - 评论12建议,论文在发表前应由独立实验室重复实验结果,但现实中研究者更关注发表论文以推动职业发展。
引用: "Papers should not be accepted until an independent lab has replicated the results."
- 评论1指出,心理学各领域的实验重复率较低,社会心理学为37%,认知心理学为42%,人格心理学为55%,临床心理学为44%。
心理学研究的激励与文化问题
- 评论2认为,心理学研究者更倾向于进行新研究而非重复实验,建议公共资助的心理学博士生应将重复实验作为培训的一部分。
引用: "The incentive of all psychology researchers is to do new work rather than replications." - 评论8批评心理学研究中的统计问题,指出研究者普遍存在“p-hacking”等统计不当行为。
引用: "They teach it wrong and have a 'well, everybody else does it' attitude towards p-hacking."
- 评论2认为,心理学研究者更倾向于进行新研究而非重复实验,建议公共资助的心理学博士生应将重复实验作为培训的一部分。
对个别实验的质疑与讨论
- 评论3提到,某些实验已被成功重复,但将其与未重复的实验并列可能不公平。
引用: "Some of these papers were successfully replicated, so juxtaposing them to the ones that have not been replicated feels a bit off." - 评论20指出,单次重复实验失败可能由于样本量不足或实验设计问题,不能轻易否定原始研究。
引用: "If the 'failed replication' was a single study, there is still an open question as to whether the replication study was underpowered."
- 评论3提到,某些实验已被成功重复,但将其与未重复的实验并列可能不公平。
心理学领域的改进与积极态度
- 评论15认为,心理学领域对可重复性危机最为重视,各领域的严谨性正在逐步提高。
引用: "Psychology has taken the replication crisis most seriously. Rigor across all areas of psychology is steadily increasing." - 评论17提到,成长心态研究尚未完全被否定,其核心理念与自我实现的预言一致。
引用: "The growth mindset study is not fully debunked yet. It's basically a modern interpretation of self-fulfilling prophecies."
- 评论15认为,心理学领域对可重复性危机最为重视,各领域的严谨性正在逐步提高。
对心理学理论的批评与未来展望
- 评论23指出,心理学缺乏可证伪的理论,导致实验结果难以验证,未来神经科学可能解决这一问题。
引用: "Psychology doesn’t have falsifiable, defining psychological theories -- because there aren’t any of those." - 评论24批评斯坦福监狱实验的不可重复性,但该实验仍被用于推广特定意识形态。
引用: "The Stanford prison experiment wasn’t reproducible but that didn’t stop Zimbardo from using it to promote his ideologies."
- 评论23指出,心理学缺乏可证伪的理论,导致实验结果难以验证,未来神经科学可能解决这一问题。
总结:评论主要围绕心理学实验的可重复性问题展开,批评了研究激励、统计文化和理论缺失等深层次问题,同时也对个别实验的重复性提出了质疑。尽管存在诸多批评,部分评论者仍对心理学领域的改进持积极态度。