INTJ、ENFP……这个测验火就一定科学吗?

精选
data.name
京师心理...

认证作家


文: hhu
来源:京师心理大学堂( bnupsychology)


如果学科也有热搜榜,心理学一定时常占据前排。什么时候会达到沸点?大概是每隔一段时间被包装得五花八门的心理学小测试刷屏朋友圈的时候。在这些小测试被火热转发的同时,也总有一群人(比如大学堂)在冷静地告诉人们,这些作娱乐之用的小测试没那么靠谱。


实际上,即使是广为人知的心理测评工具,有些也同样存在不科学之处,甚至不被心理学家承认为“科学”——比如大名鼎鼎的MBTI。


MBTI测试给人的结果是四个字母,这四个字母分别关于人的四个属性,包括获取能量、体验世界、决策依据以及生活方式。


比如,通过向内获取能量的人的第一个字母是I,表示Introvert,即我们熟悉的内向。MBTI的体系将人分为16类,对每个类型的人都有相应的解释。比如,ISFJ类型的人被称为“守护者”,因为他们


忠诚、有奉献精神和同情心,他们意志清醒而有责任心,乐于为人所需,理解别人的感受。他们十分务实,喜欢平和谦逊的人,喜欢利用大量的事实情况,对于细节则有很强的记忆力。他们耐心地对待任务的整个阶段,喜欢事情能够清晰明确。 

……



MBTI 的16种类型

维度一:获取能量的方式:内向(I) – 外向(E)

维度二:体验世界的方式:直觉(N) – 现实(S)

维度三:决策依据的方式:理性(T) – 感觉(F)

维度四:生活方式的偏向:组织(J) – 灵活(P)



有数据称,MBTI每年被超过百万人使用,超过80%的世界百强企业用它来指导招聘、团队建设、培训等;在我们身边,“积极寻求自我”的个人也喜欢拿MBTI测验中得到的四字字母来描述自己,寻找同类。


很多人对MBTI的第一反应可能是:全球范围内这么有名的心理测试,一定是科学的吧。MBTI官网首页也赫然写到,“MBTI是全世界最知名的人格测评工具之一——因为它有效(because it works)”。MBTI测试从诞生到现在将近八十年,还在被人们津津乐道地讨论和应用着,这背后一定有其原因。但很遗憾,它的“科学性”恐怕并不是原因之一。


放眼心理学界,MBTI 现在并不怎么招人待见,绝大多数心理学研究者对MBTI的态度并不是支持的,甚至有研究者将其称为“不负责任的空想哲学” [1]。原因很简单,实证研究的证据无法支持这种测评工具的科学性。作为一个心理测验,它连最基本的测量属性都饱受诟病。


一个测评工具要被认可,要经过重重关卡的考验,而MBTI在第一个关卡上就败下阵来。



第一关:时间的考验


一个合格的测评工具,要能经得住时间的考验。这意味着小明在今天测得的结果,应该和一段时间后重新测得的结果一致。然而,有研究表明,即使只过了五周,大概50%的人再次测量得到的结果就会和之前不同 [2]。


小明还是那个小明,怎么测出来就变了呢?这个问题和MBTI的计分方式有关。MBTI测了人的四个方面,每个方面都被认为是二分的。以内外向维度举例,受测者要么被判定为内向,要么就是外向,不存在“有点外向”这样模糊的答案。


然而事实上,我们大多数人的内外向水平恰恰就处于中间的某一位置,并且存在一定的波动——小明,实际上一个不怎么外向也不怎么内向的人,得分正好在分界线两侧摇摆。由于第二次得分恰好飘到了分界线的另一端,小明直接得到了和第一次截然不同的结果。


当然,人群中的确存在极度内向或外向的人,与小明相比,他们多次测得的结果更可能是一致的,但这样的人只占人群中的小部分。


实际上,对于人格的测量,心理学家倾向于抛弃这种非此即彼的解读,而是采用连续计分的方式——比如大五人格(相关内容内容可参考你是一个怎样的人?|「心灵海洋」大五人格)。与其直接根据绝对的分界线对小明的内外向盖棺定论,不如直接解读小明的得分水平在人群中的分布情况。这样得到的结果更为可靠。


图源:
https://www.idrlabs.com/articles/2014/02/mbti-for-skeptics/


无法经过时间的考验,说明MBTI 的重测信度是不达标的。这已经足够为一个测量工具盖上不合格的标签了,因为没有信度的保证,接下来的第二关也必然无法通过。


第二关:实践的检验


一个测评工具好坏与否,最直观的表现是看它能够帮助我们达到某一目的。MBTI作为在企业中被大量使用的工具,真的为企业人事决策带来帮助了吗?答案恐怕是否定的。如前所述,MBTI结果的不稳定首先让我们无法确定结果与应聘者的真实情况一致。其次,研究发现,MBTI的结果也并不能对员工或团队的工作表现进行预测。因此,至少在人才选拔和团队建设上,MBTI的作用是令人失望的 [3]。


另外,MBTI的维度划分也相当可疑。举另一个维度的例子,MBTI将人的决策方式二分为理性型或者感觉型,然而这并非是两个对立的选择。我们在做决定时,通常既有理性的分析,也会受感情的影响。事实上,有研究表明,有着良好思考和推理能力的人也能更好地识别、理解和管理情绪 [4]。


这两点体现的都是测验的效度指标,表明测验所测的到底是不是我们期望的东西。显然,MBTI在预测效度以及结构效度上同样表现得不尽如人意。


为什么MBTI还在被使用?


绝大多数研究者质疑MBTI薄弱的理论基础、信效度的不达标,学界研究早有抛弃之势。然而MBTI在企业中的应用依旧火热,相关的培训和应用行业有着不小的利益空间。企业对MBTI的偏爱很大程度上可以归因于企业相关人员对专业测评知识的欠缺。一方面,MBTI的商业成功鼓励了企业相信“大家都在用的东西”,而这恰恰进一步推动了它的“成功”。另一方面,MBTI公司每年赚两千万美元,可想而知有不少公司在MBTI上花费不菲。当我们在一个事情上花费巨大,为了避免认知失调,我们更愿意相信投入是值得的,企业也是如此。


对于想要了解自己的个人来说,MBTI或许可以拿来尝鲜,做娱乐之用,但通常人们并不完全了解它巨大的缺陷和局限性。我们偏爱简单的、有秩序的事物,刻板印象的存在也说明我们有“标签化”的倾向。也许这也是MBTI能够流行至今的原因。


它将人格这个复杂的概念大大简化,以分类的方式将人格划分为16种类型,四个字母组成的“标签”很容易给人安全感。另外,MBTI的结果十分取巧,它对人的描述只从正面出发,绝不说半点伤害到人自尊的方面,无论什么样的结果都可以被包装为“美好的糖衣炮弹”。没有这点警觉,我们无法从中获取对自己相对客观的评价。


无论是个人还是企业都应该知道,在选择测评工具这件事上,我们始终有更好的选择。如果想要测评人格,大五人格量表是不错的选择。它将人从外向性、情绪稳定性、宜人性、开放性、尽责性五个维度进行测评,不仅有着较高的信度,也能够预测工作表现、团队效率等,信效度在多个国家和文化下得到验证。近年来研究者甚至发现了大五人格对应的基因与生物学基础 [5]。


实际上,在测量人复杂的心理结构这件事上,没有工具可以完美地胜任。但可以肯定的是,MBTI等这些无法经过科学证实的工具不是我们可以信赖的选择。


参考文献
[1] Paul, A. M. (2004). The cult of personality: how personality tests are leading us to miseducate our children, mismanage our companies, and misunderstand ourselves. New York: Free Press.
[2] McCarley, N. G., & Carskadon, T. G. (1983). Test-retest reliabilities of scales and subscales of the Myers-Briggs Type Indicator and of criteria for clinical interpretive hypotheses involving them. Research in Psychological Type, 6, 24-36.
[3] Gardner, W. L., & Martinko, M. J. (1996). Using the Myers-Briggs Type Indicator to study managers: A literature review and research agenda. Journal of Management, 22(1), 45-83.
[4] Cote, S., & Miners, C. T. (2006). Emotional intelligence, cognitive intelligence, and job performance. Administrative Science Quarterly, 51(1), 1-28.
[5] Caspi, A., Roberts, B. W., & Shiner, R. L. (2005). Personality development: Stability and change. Annu. Rev. Psychol., 56, 453-484.


公众号简介:京师心理大学堂(微信号bnupsychology),北师大心理学院出品,奉行“打造中国最专业的心理学科普平台”的项目定位,努力将北师大心理学百年积淀奉献于社会,凝聚师生力量传播科学知识,让心理学走进千家万户。

责任编辑:Spencer JXLF

举报
匿名

总结出在中间态的会比较难以测评。但如果是老是测的同一类型可信度比较高

2023-12-21 · 回复
Kay

任何的测评工具都无法做到每次测试都一样的结果 因为人的行为和思想是随外界和心境变化的 既然是工具就是死板的 人的思维却是活的 不太同意笔者前面的说法 抱歉

2021-01-30 · 回复
嘉

我就是那个每次测都不一样的,每个维度都有一两个高度背离倾向的要素,越测越晕,还是放弃吧。

2020-03-28 · 回复
打开壹心理App,查看更多精彩评论
壹心理-2000万用户选择的全生态心理学服务平台