测量工具的信度与效度
2014-12-26
来源:《对“伪心理学”说不》第8版
点击数: 9332          作者:【加】基思.斯坦诺维奇 著 窦东徽 刘肖岑 译

  • 概念的操作性定义要想有用,必须同时具备信度和效度。信度是指测量工具的一致性。如果你对同一概念进行多次测评,是否能够得到相同的测量结果。信度的科学概念很容易理解,因为它与常识中的定义以及字典里的定义非常相似:“任何总能够产生相同结果的系统所具有的一种属性”。

    试想一下,一个外行人士会如何评价一件事是否可信呢?想象一个每天早上要赶公共汽车从新泽西去曼哈顿上班的人。按照时间表,公共汽车每天应该在上午720到达此人等车的站点。在一个星期中,如果公共汽车到达的时间分别是7:207:217:207:197:20,那么我们就可以说在那一周汽车的到达时间是可信的,如果下周汽车到达的时间分别是7:307:107:457:557:05,那么我们就可以说在那一周汽车的到达时间是非常不可信的。

    在科学领域中,一个操作性定义的信度以类似的方式来评估。如果我们多次测量同一概念得到的结果是近似的,那么我们就说测量工具表现出较高的信度。如果在同一星期的周一、周三和周五,用同一IQ测验的不同版本测量同一个人的智力,得到的分数分别是100109110,那么我们可以说这一IQ测试是非常有信度的。相反,如果三个测试分数分别是89130105,那么我们就可以说这一IQ测试没有显示出高的信度。有一些专门的统计方法都可以评估不同类型的测量工具的信度。所有标准的方法论入门教材中都有介绍。

    但是请记住,信度仅仅是指前后一致,而不包括其他内容。对于一个操作性定义而言,仅有信度是不够的,信度是一个必要而非充分条件。作为一个好的操作性定义,操作必须被证明对于概念来说是有效的测量。“结构效度”这个术语是指一个测量工具(操作性定义)是否测量了它本应测量的内容。保罗.考兹比教授(Cozby, 2006)在其所著的方法论教材中为我们讲述了一个只有信度而没有效度的搞笑例子。假设你想测测自己的智力,测试者让你站在一个类似鞋码器的测试仪器上,然后仪器给出一个读数。当然,你会认为这是一个笑话。但是请注意,这个测量工具可以显示出许多类型的信度,而这些信度在方法论教材中都会讨论到。这个仪器在星期一、星期三和星期五会呈现出相当一致的读数(这称之为“重测信度”),并且无论谁操作它,它都会给出一样的读数(称之为“评分者信度)。

    用鞋码器来测量智力,其问题不在于信度(这是有信度的),而在于效度。它不是一个测量它本应测量的概念(智力)的合理方式。断定它不是测量智力的有效方式之一,就是我们发现它和其他一些被认为与智力相关的变量无关。鞋码器的测量结果与学业成就无关,与脑功能的神经生理学测量无关,与职场成功无关,与认知心理学家提出的信息加工效率的指标无关;相反,真正的智力测验与所有这一切都有关(Deary, 2000; Geary, 2005; Lubinski, 2004)。在心理学领域,真正的智力测验要兼顾效度与信度,而智力的鞋器测验只有信度而没有效度。

    在这一点上,你可能想知道信度和效度的其他组合方式是否可行。因此,让我来重申一下我们的立场。在操作性定义中,我们寻求信度和效度兼备,因此高信度和高效度结合才是理想的目标。我们刚刚讨论了鞋码的IQ测试,目的是论证高信度和低效度是没用的。第三种情况是低信度和低效度,这绝对没有用,因此不值得讨论。但是你可能想知道第四种,也就是最后一种可能的组合方式:如果高效度和低信度又怎么样呢?答案是,和低效度和高信度的例子(鞋码器例子)一样,这种组合也是没用的。事实上,更准确的说法是,这类情况压根儿不可能出现。因为,如果不能进行可信的测量,你根本无法宣称测量是有效的。

相关文章
  • 暂无信息
热门评论
  • 暂无信息

验证码: 验证码,看不清楚?请点击刷新验证码

生涯规划 人才管理 心理咨询

版权所有:Copyright(C) 2011-2020  迈奇企业管理咨询有限公司

公司地址:湖北省宜昌市解放路12号步行街紫晶城H栋713室 邮编 443000

TEL:0717-6293606, 18071313938

鄂ICP备11011478号



扫描一下