1 什么是贝叶斯推理
早在18世纪,英国学者贝叶斯(1702~1761)曾提出计算条件概率的公式用来解决如下一类问题:假设H[,1],H[,2]…互斥且构成一个完全事件,已知它们的概率P(H[,i],i=1,2,…,现观察到某事件A与H[,1],H[,2]…相伴随而出现,且已知条件概率P(A/H[,i]),求P(H[,i]/A)。贝叶斯公式(发表于1763年)为:
P(H[,i]/A)=P(H[,i])P(A/H[,i])/[P(H[,1])P(A/H[,1])+P(H[,2])P(A/H[,2])…]
这就是著名的“贝叶斯定理”,一些文献中把P(H[,1])、P(H[,2])称为基础概率,P(A/H[,1])为击中率,P(A/H[,2])为误报率[1]。现举一个心理学研究中常被引用的例子来说明:
参加常规检查的40岁的妇女患乳腺癌的概率是1%。如果一个妇女有乳腺癌,则她有80%的概率将接受早期胸部肿瘤X射线检查。如果一个妇女没有患乳腺癌,也有9.6%的概率将接受早期胸部肿瘤X射线测定法检查。在这一年龄群的常规检查中某妇女接受了早期胸部肿瘤X射线测定法检查。问她实际患乳腺癌的概率是多大?[2]
设H[,1]=乳腺癌,H[,2]=非乳腺癌,A=早期胸部肿瘤X射线检查(以下简称“X射线检查”),已知P(H[,1])=1%,P(H[,2])=99%,P(A/H[,1])=80%,P(A/H[,2])=9.6%,求P(H[,1]/A)。根据贝叶斯定理,P(H[,1]/A)=(1%)(80%)/[(1%)(80%)+(99%)(9.6%)]=0.078
心理学家所关心的是,一个不懂贝叶斯原理的人对上述问题进行直觉推理时的情形是怎样的,并将他们的判断结果与贝叶斯公式计算的结果做比较来研究推理过程的规律。因此有关这类问题的推理被称为贝叶斯推理。
2 贝叶斯推理研究概况
2.1 基础概率忽略现象的发现与争论
Kahneman和Tversky开辟了概率推理这一重要的研究领域。他们在20世纪70年代初期的研究首先发现,人们的直觉概率推理并不遵循贝叶斯原理,表现在判断中往往忽略问题中的基础概率信息,而主要根据击中率信息作出判断。他们一个经典性的研究[3]是:告知被试100人中有70人是律师,30人是工程师,从中随机选出一人,当把该人的个性特征描述得象工程师时,被试判断该人为工程师的概率接近0.90。显然被试忽略了工程师的基础概率只有30%。后来他们还采用多种问题验证基础概率忽略现象[4],如让被试解决如下出租车问题:一个城市85%的出租车属于绿车公司,15%属于蓝车公司,现有一出租车卷入肇事逃逸事件,根据一目击者确认,肇事车属于蓝车公司,目击者的可靠性为80%。问肇事车是蓝车的概率是多少。结果大多数被试判断为80%,但如果考虑基础概率则应是41%。
这一研究结果引发了20世纪70年代以来的大量研究。有研究支持其结论,如Eddy用前述乳腺癌问题让内科医生判断,结果95%的人判断介于70%~80%,远高于7.8%[2]。Casscells等人的研究结果表明,即使哈佛医学院的工作人员对解决如乳腺癌和与之相类似的问题都出现同样的偏差[5]。
但也有研究发现,在许多条件下,被试对基础概率的反应是敏感的。例如,如果问题的措辞强调要理解基础概率与判断的相关性[6]或强调事件是随机抽样的[7],则基础概率忽略现象就会减少或消除。另一个引人注意的是Gigerenzer和Hoffrage1995年的研究,他们强调概率信息形式对概率判断的影响。采用15个类似前述乳腺癌的文本问题进行了实验,问题的概率信息用两种形式呈现,一种沿用标准概率形式(百分数);一种用自然数表示的频率形式,如“1000名妇女中有10名患有乳腺癌,在患有乳腺癌的妇女中8名妇女接受早期胸部X射线测定法检查,在没有患乳腺癌的990名妇女中有95名接受早期胸部X射线测定法检查”。结果在频率形式条件下,接近50%的判断符合贝叶斯算法,而在标准概率条件下只有20%的判断符合贝叶斯算法[8]。
而另一些研究者对此也提出异议,有人认为他们在改变信息形式的操作中,同时也改变了其他的变量。如Lewis和Keren[9]提出这种概率信息的改变使原来的一般性问题变成了当前单个情境的具体问题,因而问题变得容易,被试判断的改善不能说明他们的计算与贝叶斯计算一致。另外Fiedler认为[10],他们进行频率形式的操作为所有数据提供了一个共同的参照尺度——即所有数据都是相对于总体(1000名妇女)而言的,依靠它所有的数据变得容易比较。很明显,接受X射线检查并患乳腺癌的妇女的数量(8)与接受X射线检查并无乳腺癌的妇女的数量(95)相比或与接受X射线检查的妇女总数(103)相比都是非常小的。相反,在标准概率条件下,没有共同的参照尺度,表面上击中率(80%)远高于误报率(9.6%),但它们是相对于大小不同的亚样本,而不是相对于总体,不能在同一尺度上进行数量比较。于是他们用4个问题进行了2(数据比较尺度:共同尺度/非共同尺度)×2(数据形式:标准概率/频率)的被试间设计,实验结果表明:不管采用哪一种数据形式,被试在非共同参照尺度条件下,判断准确性都低,在共同参照尺度下,判断准确性高。所以判断准确性与数据形式无关。
可见,人们在概率判断中忽略基础概率是不是一种普遍现象,不同的研究之间存在较大分歧。这将促使研究者们采用各种方法对人们的概率判断推理过程进行更深入的探讨。
2.2 贝叶斯推理问题的研究范式
为了探讨上述问题,人们采用了不同的研究范式。从已有的研究看,贝叶斯推理的研究范式主要有两种,一种是文本范式,一种是经验范式。
文本范式是实验中的问题以文本的形式直接提供各事件的基础概率和击中率、误报率等信息,让被试对某一出现的事件作出概率大小的判断。如前述的乳腺癌问题,工程师问题,出租车问题等的研究就是采用这一范式。
然而,在实际生活中,人们进行概率判断需要从自己经历过的事件中搜集信息,而不是像文本范式那样被动得到这些信息。经验范式便克服了文本范式的这一缺陷。经验范式就是在实验中让被试通过经历事件过程,主动搜集信息来获得基础概率、击中率和误报率等各种情况的信息,然后作出概率判断。
例如,Lovett和Schunn[11]为了探讨基础概率信息和特殊信息对被试解决问题策略的影响,利用建筑棒任务(Building Stick Task,BST)进行了实验设计。对于一个给定的BST问题来说,计算机屏幕下方提供3条不同长度(长、中、短)的建筑棒并在上方显示一条一定长度的目标棒,要求被试用建筑棒通过加法(中棒+短棒)策略或减法(长-中或短棒)策略制造目标棒。被试只能凭视觉估计每条棒的长度,迫使他们不能用代数方法而只能用策略尝试来解决问题。基础概率是两种策略解决问题的基本成功率;特殊信息是建筑棒与目标棒的接近类型对选择策略的暗示性和所选策略成功的预见性:长棒接近目标棒则暗示使用减法策略,中棒接近目标棒则暗示使用加法策略,如果暗示性策略成功表明该策略具有预见性,否则为非预见性。问题设计时,在200个任务中控制两种策略基本成功率(偏向:一策略高(如70%),另一策略低(如30%);无偏向:两策略各50%)和暗示性策略对成功预见性的比例(有预见性:暗示性和非暗示性策略成功率分别为80%和20%;无预见性:暗示性和非暗示性策略成功率各50%)。研究者对被试在尝试上述任务前后分别用10个建筑棒任务进行了测试,发现被试在尝试前主要根据特殊信息选择策略,在尝试后主要依据两种策略的基本成功率信息选择策略。说明人们在尝试200个任务后对尝试中的基础概率信息的反映是敏感的。
经验范式的优点在于,实验操作过程非常接近人们在日常生活中获得概率信息以作出判断的情况,较为真实地反映了人们实际的表征信息和作出概率判断的过程。所以许多研究者采用了这一范式[12-14]。
但研究范式的变化并没有能消除前述的争论,在不同的研究范式下都存在人们对基础概率信息的忽略或敏感现象,并出现了各种对基础概率信息忽略或敏感现象进行解释的理论。
3 几种主要理论
如前所述,人们进行概率判断时,在一些条件下忽略基础概率,在另一些条件下并没有忽略基础概率。那么,人们是如何作出判断的呢?哪些因素在影响人们的概率推理呢?对此,不同的研究者提出了不同的观点。
3.1 启发法策略论
Kahneman和Tversky认为人们直觉的概率推理受认知策略的影响,这是一种依赖于经验的判断或猜测。所以,经常会作出错误的判断。主要的认知策略包括“代表性启发法”和“可得性启发法”。
代表性启发法是指人们倾向于根据样本是否代表或类似总体来判断其出现的概率,愈有代表性的,被判断为出现的概率愈大,愈少代表性的被判断为出现的概率愈小。例如,在他们的研究中,要求被试估计某城市有6个孩子的家庭中,男(B)女(G)儿童出生顺序为GBGBBG和BGBBBB(B代表男孩,G代表女孩)的比例,结果大多数被试估计前者远高于后者[3]。因为前者更能代表整个人口中的比例,其次它看起来更随机。但从机会来说,两者的概率应是相等的。
可得性启发法是指人们倾向于根据某现象在知觉或记忆中容易得到的事例来估计其出现是概率,如他们在实验中要求被试估计英语中以字母R、L、N、K、V开头的单词数和以它们为第三个字母的单词数,结果绝大部分被试估计前者远多于后者[15]。但实际上前者是的基础比例远低于后者的基础比例。判断错误的原因在于人们更容易回忆出以这些字母开头的单词,而不容易回忆起它们在中间位置的单词。这与人们的记忆组织有关。
3.2 自然抽样空间假