↑点击收听↑ 文/李万中 播/小新
节选自《思维的利剑》
在进行因果解释时,人类最有力的工具,就是实验法(experimentation)。大家已经知道了什么是变量,变量就是人类对世界的数量化的认识。人的身高是一种变量,大象的体重是一种变量,一年中下雪的天数也是一种变量。有些维度难以量化,比如人类的聪明程度、敏捷程度,但我们可以发明智商测量等量表去尽可能地量化这些维度。
有了各种各样的变量,人类就开始去寻找这些变量之间的关系。这个时候,统计学的作用就能得到充分的体现。我们可以有各种复杂的计算方法,有各种实用的数学模型,来探索变量之间的关系。
其中,相关(correlation)这个概念格外值得注意。相关就是指变量之间是有联系的,不是互相独立的。我们有三种相关,一种是正相关,也就是一个变量增加时,另一个变量也增加。比如人的年龄和身高在一段时间内就是正相关。另一种是负相关,也就是一种变量增加时,另一种变量反而降低。人的年龄和身高在一段时间内也可能是负相关。还有就是零相关,也就是两个变量之间没有明显的关系。比如中国的人口数量和南美洲的地震次数这两个变量之间就是零相关。
大家要注意,两个变量有相关关系,并不意味着两个变量有因果关系。A和B在统计上相关,有可能是A导致B发生,也可能是B导致A发生,也可能是另外一个变量c同时导致A和B发生。
假设我们发现,学历越高的人,家中就有越多的书,那么,学历这一变量和书的数量这一变量就是正相关的。但会有哪些可能导致这个正相关呢?可能是高学历者会买更多的书,也可能是买了更多的书使得此人拥有更高的学历,也可能是高学历和买书有互相促进、互为因果的作用。当然,也可能是“有钱”这个第三变量,导致此人拥有高学历和更多的书。而要确定变量之间真正的因果关系,我们就需要做实验。
实验法的核心,就是控制变量。这个世界上的变量何其之多,几乎所有变量都有或多或少的关系。但我们最关心的,是少数变量之间的关系,是一个变量和另一个变量有没有因果关系。如果仅凭调查和统计,我们无法做出因果判断,因为和A相关的不仅有B,还有C、D、E、F等。所以我们需要在实验室条件下,保持C、D、E、F等变量不变,然后调整变量B,看变量A是否有相应的变化。
就让我们以药品检验为例,向大家介绍一下如何做实验。如何判断板蓝根能否治疗感冒?我们发现,有人患了感冒,然后吃了板蓝根,然后感冒好了。但我们能说感冒好了的原因是吃了板蓝根吗?要如何设计一个实验,去判断吃不吃板蓝根这个变量,是不是感冒好没好这个变量的原因呢?
如果在最理想的条件下,那我们就要找上百甚至上千个人,然后将这些人随机地分成两组。将这两组人都暴露在感冒病原体面前,使得这群人都患上感冒。其中,我们让一组人吃下板蓝根,另一组人则不做处理。
接下来,我们就观察那组吃了板蓝根的人,感冒痊愈的速度和数量,和没有吃板蓝根的那群人,有没有差异。假设不管吃没吃板蓝根,两组人都是3天后感冒就好了,这说明板蓝根没有效果。假设吃了板蓝根的那组人,感冒1天后就都好了,没吃板蓝根的要3天后才好,这说明板蓝根有效果。
大家以为这个实验设计得怎么样?如果大家都是初中生或者小学生,那这个实验设计成这样,也算是合格了。幸好,国家食品药品监督管理局的人是不会雇用小学生和初中生来设计实验检验药品的作用与食品的安全性的。真正好的实验,还要控制更多的变量。在药品检验中,我们还要用双盲实验(double-blindexperiment)。
换言之,我们不仅要让一组人吃下板蓝根,还要让另一组人吃些淀粉之类的无关物质。这样就能保证两组人都吃了点儿东西,而不是一组人吃了东西,另一组人没吃东西。我们还不能告诉这两组人,究竟是哪一组人吃了板蓝根,又是哪一组人吃了淀粉。而且我们还要设置一组人什么东西也不吃,作为对照组。否则的话,我们无法验证安慰剂(placebo)的作用。
安慰剂就是没有物理作用但是有心理作用的东西,在一些止疼剂的作用里,安慰剂能发挥90%的作用。在板蓝根的例子里,如果吃了板蓝根的人在3天后感冒痊愈了,吃了淀粉的人在3天半后感冒都痊愈了,啥也没吃的人在4天后感冒也都痊愈了,那我们可以说,板蓝根本身几乎没有药理作用,几乎都是安慰剂的作用。而且,安慰剂的作用也不大,因为不吃安慰剂,也只是延迟半天痊愈而已。
不让参加实验的人知道自己是否接受过实验处理,这就是单盲。既然叫双盲实验,那还有一盲呢?还有一盲就是让做实验的人也不知道哪些人接受了实验处理,哪些人没有。
单盲实验能检验安慰剂的作用,而双盲实验不仅能检验安慰剂,还能排除因实验人员的期望所导致的实验误差。从一堆小白鼠中随机抓取几只,分给两组人去做实验,测验这两组小白鼠在走迷宫任务上是否有成绩上的差异。虽然小白鼠是随机抓取的,但是却告诉一组人,分给他们的那几只都是天资聪颖的天才白鼠,告诉另一组人,分给他们的都是比较蠢的普通白鼠。
如此一来,我们控制了白鼠本身的能力,唯一的变量就是实验人员对白鼠走迷宫成绩有了不同的期待。而实验的结果也正如我们所料,那组“天才白鼠”的成绩比普通白鼠要高不少。而这成绩之间的差异,不是因为白鼠自身,而是因为实验人员对它们的期待有差异。这就叫期望效应(expectationeffect)。期望效应其实就是实验者的实验操作不严格所导致的。所以,在药物检验中,为了防止实验人员的期待对实验结果造成影响,我们就要做双盲实验。
顺带一提,没有任何中药通过了严格的双盲实验。这个双盲实验的威力也不仅仅在于检验药物是否有效。
任何涉及人类感受的变量,都可以做双盲实验。100万元的小提琴拉出来的声音是否真的比1万元的小提琴要好听?1000元的酒是否真的比100元的酒要好喝?5000元的衣服穿起来是否比50元的要舒服?杰出艺术家的名画是不是真的比美术学院刚毕业的学生的作品要好?
在双盲实验下,没有了安慰剂和期望效应的作用,变量之间真正的关系在我们面前就会一览无余。
1.《双盲实验里的“双盲”是什么意思?》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《双盲实验里的“双盲”是什么意思?》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/jiaoyu/15408.html