随着大数据和人工智能的发展,生活中面临许多选择,而这些选择大多又跟概率有关,贝叶斯定理就是概率理论中那一抹灿烂的光,人人都需要。

可能很多人和我开始的感觉一样,有点绝望,本来从小数学就不好,你这么专业的名词,还人人都应有,我没有!别着急,先看看下面这些场景。

1

从生活场景认识贝叶斯定理

场景1.与陌生人相处:到底什么时间发好人牌比较合适

我*次和你见面,不知道你,对你一无所知,我怎么评价?

对你是不了解,但是我对人类还是有点了解的,经验的看法三七开,七分好,三分坏。

跟你交往开始假设就是三七开,聊了一个小时的天感觉你还不错,加一分,变成了二八开。

接着跟你共事了一年,感觉你人品挺好,做事负责,就变成一九开了。

场景2:电视剧情:高潮迭起的快乐你不懂

比如前段时间比较火的电视剧《重生》中,剧情一开始众多兄弟惨遭误杀,自己虽捡回一条命,却不幸失忆,还有陌生人的录音,让观众以为秦驰就是黑警,后面朴素迷离的剧情,让人一直无法判断秦驰的真实面目,在好人和坏人之间徘徊,直到之后一刻,在意外的又一次重创之后回忆起了所有细节,*终还了自己一个清白。

剧情就是信息,新剧情的发展会对原来的认知进行修正,只不过在剧情当中,有些特殊,是呈现出以下特征:

1.通常是二值分布,在法律的角度要么是犯法要么没犯法;

2.有些是概率分布,比如对某个角色的好恶程度,会随着剧情的发展而变化,这种好恶程度会给某个人打分。

看剧更加应该关注过程,也就是新信息的价值,只有关注过程,才能有高潮迭起的快感,结尾只是一个仪式。

场景3:交友:她到底爱不爱我(行动的价值)

某男生在分手后向你诉苦:我以为她爱我就不会离开我,谁知道说走就走了。

你闺蜜在她分手后向你求安慰:我以为他爱我就会来找我,结果,这么狠心。

你面带鄙视的表情,甩给他们:你以为,你以为有个屁用!人家爱不爱你,你没有点*数吗,你们过往的点滴难道就不能给你们一点参考吗,有人说很多的分手都是蓄谋已久,分手前对方的表现难道就没有什么征兆吗。

每个人都抱着“我以为的”的心态,一步步将自己推向死角,爱他就要主动,要什么面子,唯有行动,才能得到反馈,才能证明他在你心中的位置。

过去不会说谎,行动证明现在,未来才不会后悔。

场景4:朋友借钱:看人品借钱

有两个人,一个是你*为信任的朋友,另一个则口碑不那么好。他们同时向你借相同的钱,同时逾期未还。

你不会太担心你的朋友,会觉得他只是一时疏忽了,而另一个人则不一样,你会认为他是存心不还,想着要不要去催他一下,或者以后再不借钱给他。

你看,在这里我们又对同样一件事情产生了不同的解释。

对信任的朋友,我们的先验知识认为他借钱不还的概率更小。但是,当这样的事情发生多次之后,我们也会调整对他的预期。

类似的还有征信在银行风控领域的作用,比如从小额消费贷到大额的抵押贷、经营贷。小额的一般都是信贷,正常信用卡的申请都要查征信,白户的一般会给一个基础分(有的甚至更低),大部分网贷虽然不查、征信,但也会拉一下个人的大数据,也会给出一个基础分。

然后再参考个人的资产状况、职业、收入,抵押物对这个基础分进行修正,*终出一个额度。

等合约到期,续约或下次申请的时候会再次查询征信,再次尽调,根据过去的履约情况和*的资产收入情况进行修正,不断修正,不断更新额度。

当然,如果一开始你的资质就比较差,没有达到金融机构的门槛,也就是初始概率比较低,但后来不管是天降横财还是事业走运,银行就会对你重新做一个评估,*终给你发一张富人卡。

场景5:公司招聘:学历很重要,工作表现也重要

一直以来有一个争论:企业招员工该不该看学校出身。

如果我们站在先验概率的角度,就会觉得企业招员工认学校很正常:名校的学生个人能力强的概率更大,因此他们在企业对员工能力的认知中占据优势。

非名校的学生,需要付出更多的努力、表现的更突出,才能够调整回企业对你能力的先验认知。

而名校学生,当多次表现不佳之后,企业也会下调对你能力的先前认知。

从这个角度来看,先验概率是个很公平的工具,过去的所有表现,都反映在这个概率之中——做的好一点,概率就涨一点;做的差一点,概率就跌一点。货真价实,童叟无欺。

2

贝叶斯定理出现的背景

以上几个场景你可能很熟悉。其中提到的理论就是贝叶斯推理,

简而言之,就是

1.给一个既有的判断。

2.获得新的信息不断调整更新。

想要了解贝叶斯推理,我们还要从概率学派开始说起

在200多年前,传统的方法叫频率派。关于频率和概率的区别,很多人不熟悉。简单的说,概率说的是事情未来发生的可能性,而频率说的是对某事情进行观察或者实验,发生的次数和总次数的比值。

概率是事情本身的一个固有属性,是一个固定值,而频率是变化的,样本越大,频率越接近概率。根据大数定理,当样本无穷大时,频率等于概率。

你抛硬币10次,不见得会正面反面各5次,但是你抛1万次,那基本是正反各50%。比如那个黑盒子,你不断的从里面随机的拿球出来,统计黑球和红球的比例,次数“足够多”时,你得到的那个频率,就接近真实的概率。

这个方法用了上百年,现在仍然被广泛使用,比如某某疾病的发病率,飞机和火车的出事概率等等 ,都是利用大样本的统计,逼近真实概率。

这些都属于正向概率,在贝叶斯出生之前,人们都已经能够计算“正向概率”,但为什么会出现贝叶斯学派呢?

因为频率派的局限

关于足够多的样本:你只有积累了一定数量的样本,才能有一个对概率的初步判断,你只扔5次,只取10个球,基于小样本得出的概率很可能错的离谱。如果这个黑盒子够黑,你连里面总共有多少个球都没概念,甚至里面的球的总数量都是变化的,这时你就没法判断什么叫“足够多”。

时代变化太快,新问题越来越多:现实世界里,我们碰到的大量问题,根本找不到这么多现成的数据。还有很多新兴事物,压根没有先例,一种新发现的疾病,一个新的产品,一种新的市场策略,那怎么判断概率呢?瞎蒙吗?

也对,也不对。

这就需要贝叶斯学派了。

贝叶斯学派的观点是,概率是个主观值,完全就是我们自己的判断,我可以先估计一个初始概率 ,然后每次根据出现的新情况,掌握的新信息,对这个初始概率进行修正,随着信息的增多,我就会慢慢逼近真实的概率。

这个方法完美的解决了频率派的两个问题,我不用等样本累积到一定程度,先猜一个就行动起来了,因为我有修正大法,而且我也不关心是不是“足够多”,反正我一直在路上。

贝叶斯学派诞生两百多年来,一直倍受争议,甚至连co-founder拉普拉斯自己都放弃了,因为大家觉得这个摸着石头过河的方法太扯了,太不科学了。直到*近几十年,随着计算机技术的进步才大放异彩,现在的人工智能、图像识别、机器翻译等,背后无不采用了贝叶斯方法。

3

贝叶斯定理经典案例:HIV检测

那我们需要看看,贝叶斯方法究竟是怎么摸着石头过河的。

这一部分涉及一些数学公式和计算,但说实话 ,只需要小学算术水平就可以了。

【贝叶斯定理如下: A是你要考察的目标事件,P(A) 是这个目标事件的先验概率,又叫初始概率,或者基础概率。B是新出现的一个新事件。P(A|B) 的意思是当B出现时A的概率,在这里就是我们需要的后验概率。P(B|A) 是当A出现时B的概率。 P(B) 是B出现的概率,在这里具体计算稍微复杂一些,指当A出现时B的概率和当A不出时(用A_来表示)时B的概率的总和,用公式表达就是 P(B) = P(B|A) * P(A) + P(B|A_) * P(A_)。P(B|A) / P(B) 可以看作一个修正因子。】 上述解释你可以忽略,简化的理解为: 后验概率 = 先验概率 x 修正因子 让我们再来看一个复杂一点的例子,这是一个经典的案例 ,网上随处都可以找到。 说案例之前,先普及几个医学概念: 检测率:当某人确实患病时检测结果是阳性的概率误诊率:当某人没有患病时检测结果是阳性的概率发病率:随机从一定数量的人群中抽样,抽出某人确实患病的概率,通俗的讲就是艾滋病携带率或者感染率。 据资料统计:艾滋病毒(HIV)检测技术的*度相当惊人,检测率已经达到99.9%,而误诊率为0.01%,发病率为0.01%。现在假设我们随便在街头找一个人给他做检查,发现检测结果是HIV阳性,那么请问,这个人真的携带HIV的可能性是多大呢?

【我们使用贝叶斯定理。A表示“这个人真的携带HIV”,B表示“检测出HIV”,那么根据现有条件,P(A) = 0.01%,P(B|A) = 99.9%,P(B|A-) = 0.01%,带入公式,计算得到P(A|B) = 0.01% * 99.9% * (99.9%*0.01% + 0.01%*99.99%) = 50%!】

答案或许和你的直觉不一致,即使在这么惊人的检测*度之下,哪怕这个人真的被检测到HIV阳性,他真有HIV的可能性也只有50%。

也许就是这一个错觉可能就会影响一个人对生活的希望,尤其是对于潜伏期如此之长的疾病来说.

进一步解释

【其实*终的检测结果还是取决于三个条件:检测率、误诊率、感染率。任何一个概率的变化都会影响*终的结果。

我们看到,如果是一种*罕见的病毒,人群中只有万分之一的人感染,在这种情况下即使你的检测手段(检测率)再高,也很有可能会冤枉人。

甚至,如误诊率不是0.01%,而是0.1%的话,也就是检测手段再差一档,这个结果就会瞬间从50%降到9%。

但是,我们也可以反过来想 ,这么罕见的疾病,一旦被检测出来了,也有50%的概率真的会得,这个跃迁是从万分之一,一下子到了50%。

而如果我们假设这个病毒的感染率不是万分之一,而是千分之一,那么在原来的检测精度下,可能性就从50%升到了90%。】

这其实可以解释为什么我们说一叶知秋,为什么说当你家发现了一只蟑螂,那么你家里一定已经有很多蟑螂了。

罕见事件,可以对初始概率做出数量级的改变。同时,这也解释了我们有时也不能反应过度,有人叛逃到国外了,我们难道需要彻底关闭海关吗?真的需要在墨西哥修建长城吗?

关于初始概率,在医学临床上,有经验的医生在诊断病人时会询问病人双脚是否浮肿、或毫无征兆的测量脉搏、或看病人的舌苔,而不是直接让病人再去做一次超声波心电图。

检查只是调整概率的工具,更重要的是医生所拥有的强大先验知识储备——可称之为经验或者直觉。如果缺乏对先验概率的认知,检测*可能沦成一台“垃圾进”、“垃圾出”的机器。

除了医生以外,其他领域的*之所以被称为*,就是因为他们的经验给了他们判断事物时的先验概率比正常人要高,经验越多,这个概率就越高,再加上其他技术手段进行修正,得出事物的概率就会更上一层。

4

运用贝叶斯定理时的障碍

或许你会说,搞这么复杂干嘛,有了新情况,我原来的看法会改变,新情况和自己的预期一致就强化原来的看法,否则就弱化,这不就是常识吗,还用得着什么数学定理吗?

很好,的确一针见血。拉普拉斯说过,所谓的概率就是把人们的常识用数学表达出来。也有人说,人脑就是采用贝叶斯方法来工作的。

但是我们人脑有偏差啊,有误区啊,会犯浑啊,比如,在对于贝叶斯定理的运用还有很多障碍。

1. 违反天性

生活中运用贝叶斯定理,需要我们根据新的信息,不断更新已有的观念和判断。听起来人人都应该如

此,实际上是很难做到。

这一定程度上是反本能的,人天生具有不愿改变和封闭自保的惯性。领导做个决定,他会一直感觉这个决策是对的,新的事实出现,他会硬拉别的理由解释这个事实。

2. 认知障碍

观点随新近出现的事实发生改变,听起来简单,但很多人做不到,很多人的认知是陷在两个坑里:

1.就是把身边观察到的事实,局部,特例,当作整个世界来认知。听说隔壁老王炒股发达了,带上身

家一个勐子扎进去。

3. *,*杂志,实验室出来的成果就是对的。你怎么知道一定对?可能过去对,现在就不一定对了,贝叶斯的理论是更加优化的方法,随新近的事实不断改变。

而恰恰这个贝叶斯公式让我们忽然获得了一个上帝视角,来审视一下,我们自己究竟是怎么做判断,做决定的,计算机又是怎么模仿并超越我们的,这岂不是很美妙的一件事情 。

5

贝叶斯定理给我们的启示

既然贝叶斯定理这么神奇,这么有用,能够让我们在有限的信息下,帮助我们预测出概率,那岂不是人人都需要掌握呢,我小学文化水平能hold住嘛

现实世界中,我们没法时时刻刻拿出电脑来演算一下公式,但是我们仍然可以通过这个定理得到一些宝贵的启示:

1、先行动起来:大胆假设,小心求证。不断调整,快速迭代,这就是贝叶斯方法。

当信息不完备时,对概率的判断没有把握时,当然可以选择以静制动,但是不行动也是有代价的,你可能会错过时机,你也没有机会进步。这个时候,贝叶斯方法给我们提供了一个很好的思路,先做一个预判,动起来,利用新的信息不断修正原来的预判。

2、听人劝、吃饱饭,但又不能听风就是雨。

当我们没有把握时,我们很容易根据新信息调整看法。更大的挑战是,我们已经形成了一个看法,甚至有了成功经验时,当新情况出现后,我们能不能也去调整自己看法。那个黑盒子,我们摸索了一段时间,估计出了里面红球、黑球的概率,但是我们有没有想过,这个黑盒子里的球的比例会变化呢?

有了新信息,我们要对原来的看法做多大程度的修正呢?

这些,不可能有标准答案,但是明白了这个道理,有助于我们及时又谨慎的做出调整。

3、初始概率很重要。

初始概率越*,我们就能越容易、越快速的得到真实的概率。疑邻盗斧,以貌取人,会让我们离真相越来越远。而如何获得相对靠谱的初始概率,是个硬功夫,它需要你的经验、人脉、平时的深度思考,有时甚至和底层的价值观、思维方式都有关,这也可能是我们成为专业人士的一个意义所在吧。

4、对出现的特殊情况要引起足够的重视。

前面我们已经看到了,万分之一概率的事情,也有可能因为特殊事件,一下子变成了50%。所以,每当出现特殊的、罕见的情况时,我们要保持高度警惕,黑盒子里的球的比例是不是变化了?但同时我们也看到,如果检测精度不够高,即便出现了罕见事件,真实概率也可能不到10%。所以,具体要怎么采取行动,还需要进一步观察。

5、信息的收集,信息的质量,以及对信息的判断,是提高决策水平的*重要环节。

只要有新信息,就可以修正,哪怕初始判断错了,新信息足够多,也能修正过来。但是没有信息,就没有修正。所以,在做决定之前,尽可能多的收集信息是必须的。而搜集新信息的能力往往跟语言能力(比如英语)、搜索技术(在海量信息中找出你想要的的信息)、人脉都有很大很大的关系。

但是错误的信息、低质量的信息,会让你的修正偏离真相越来越远,你能不能区分信息来源的可靠性、能不能进行交叉验证、逻辑推理,就显得至关重要。

写在*:

要做到这些,甚至某一些,都并不容易,掌握里面的平衡,就更加困难。

如果说先验概率是对过去的认知,那么修正因子就是对现在的反映。过去和现在,是通向未来的*向导。如果你忽略其中任何一个,那你都将对未来做出及其荒谬的判断。

不是吗?

所谓高手,就是脑袋里装着贝叶斯定理,也把自己活成了贝叶斯定理。