(1)社会测量的表面效度和内容效度的主要区别
①从定义上看,表面效度是指测量结果与人们头脑中的印象或学术界形成的共识之间的吻合程度,如果吻合程度高,则表面效度就高。内容效度是指测量在多大程度上涵盖了被测量概念的全部内涵。测量工具代表概念定义的内容越多,则内容效度就越高。
②从测量方式上看,测量是否有表面效度,主要是基于个人的主观判断,因此,在测量那些人们比较容易理解或容易达成共识的概念时,比较容易获得较高的表面效度。内容效度的测定也是通过主观判断来实现的,但由于有概念定义作为客观依据,因此,随意性比表面效度小。
③从适用范围上看,表面效度虽然是最容易评估、也是最基本的效度类型,但它并没有被学术界广泛接受。一方面,是因为它的评估比较容易受到测试者个人因素的影响;另一方面,除了一些极端情况以外,在实际测量中采用的每一种测量方法,或多或少总有一些表面效度,因此,很难判定哪个测量不具备表面效度,这样也就无法有效地运用表面效度来评估测量质量了。
在科学研究中,测定内容效度通常需要由有关专家对测量指标进行仔细检查和分析。专家们首先要将测试内容与测试设计者列出的测验项目大纲进行比较,同时判定哪些项目保留,哪些项目删除;然后,专家们要确定不同部分在测试中的比例,并计算出不同专家之间的一致性程度。最后通过进一步的调整,形成测量工具。
(2)表面效度和内容效度存在区别的举例
①表面效度。由于人们普遍认为对自己能力评价的高低,从一个侧面反映出个人“自尊心”的强弱,所以,测量“自尊心”这个概念时,可以询问被调查者是否认为自己的能力强于他人。也就是说,用个人对自己能力的主观评价来测量“自尊心”这个概念是一种具有表面效度的测量方法。
②内容效度。在“社会阶层”这个概念的定义中,通常包含教育程度、收入程度与职业等数个层面。如果测量“社会阶层”的测量工具只包含收入层面的指标,就明显缺乏内容效度。又如,一份测验英语能力的试卷,如果只有语法、词汇和阅读的测试项目,就不能说它具有较高的内容效度,因为该试卷还缺少听力和写作的测试项目。