费米估计法

 先抛出一个问题,2020年中国新生儿数量多少?

我们有三种方法给出答案

1-直接瞎鸡猜法

这个就不用多说了,50万,100万,1000万,2000万总有一款适合你

2-比率瞎鸡猜法

先估计个每年的出生率,大概有2%?3%?然后乘以人口基数得到答案。当然本质也是瞎鸡猜

3-费米估计法

首先人口14亿是个先验信息,我们假设中国只有一种家庭:两个老人两个夫妇两个子女。这样的话中国家庭数共有14/6=2.3亿个。其实我们假设每个家庭只存在30年(子女30岁时爷奶离世),因此等于说每个家庭每年会生出2/30个新生儿,这样的话2020年出生人口=2.3*1/15=1533万。(估计方法有很多,如估计育龄妇女等,流程类似)
实际上出生了1200万个人
由此可以看出费米估计法的迷人之处:虽是瞎猜,但瞎的有逻辑,具有说服力和修正空间。费米估计发实现了经验和理性的结合,既能够避免经验的估计漂移,又能解决理性的无从下手。

不要小看费米估计法的作用,假如你是个需求预测员,你老板让你预测下个月的羽绒服市场需求时你怎么回答?你可能随口来个300件,或者把本月的销售量200件报上去,但是当老板问你数据是如何得出的时,一切都完犊子了。你大可以说,这个月200件,但是由于春节临近,可能多来100件,一共是300件。
你可能会说,不公平,你没说春节的信息。其实不是的,费米估计法就是让你能够从手头上仅有的可怜信息去进行下一步估计,有信息不用怪谁,用了就已经是费米推断了。

费米估计法的内在逻辑

整个解答流程如下:对很难直接回答的问题进行拆分,形成新的更小问题,进行递归循环,形成众多易于回答的小问题,进行回答后汇总得出总答案。
如估计新生儿数量,咋看无从下手,不过我们可以利用一些关系式,如:
新生儿≈孕妇数量≈育龄妇女人数*当年生育意愿
----当年生育意愿≈一般生几个孩子/育龄期间
--------一般生几个孩子≈经验观察≈1.5个(三胎政策说明生的远不到两个)
--------育龄期间≈45-20=25年
----当年生育意愿≈1.5/25=0.06
----育龄妇女人数≈女性总数*育龄占比≈14/2.1(性别比例)*40%(人口金字塔估计)≈2.7亿
新生儿≈2.7*0.06=1620万---(还不如第一种估计法呢😰)

我们可以发现费米估计法的内在逻辑,利用手头信息对有把握的问题做出回答,形成新的可靠信息去解决更难的问题。

准确度的影响因素

1-对最基本答案的确定程度。费米估计法靠的就是用小问题的精确估计来提高整体估计的准确度,如果小问题都拿捏不定,那么从根上已经估计偏大了,会导致后续估计跑偏。在上个例子中,妇女人口估计误差不大(2.7~3),但是当年生育意愿就大了(1.5-1.3),一下子把答案高估上去了。这同时也说明对小数字的估计误差会多么的显著,60%和61%没差别,2%和3%差别大了去了。
2-对后续答案的确定程度。这和上面说的并不是一回事,对最基本问题的回答就是一种先验的了,是直接给出的而不是估计出的;后一层答案依靠前一层答案和逻辑推断,所以说前一层的准确度很重要,如何运用那些信息得出本层的正确答案也很重要。
3-层级数。一般来说层级越多误差越大。因为下层误差会导致上层更大的误差,误差随着层级而不断方大,犹如牛鞭效应(扫盲点击这里)。为什么说是一般捏?因为还有一种情况就是层级之间的误差会相互低效,但我jio的是不常见滴:)。至于有些人说“如果每层都预测较准的话,多层级是不是能增加准确度?”,99%*99%<99%,。另外增加层级的目的是得到更准确估计,如果增加层级带来的估计难度降低能够弥补层级增加带来的误差放大,那么加层就是可取滴。

一点思考

越活越觉得贝叶斯的那一套东西真的是太妙了,人来到世上肯定不是空虚虚的,一定有什么先验的知识,就像是BIOS,否者的话我们根本无法学习任何东西。学习的过程就是一个不断根据先验知识和所接受信息来调整认知的过程。所以捏,要保持一颗开放的心,因为我们人类本就如此。










评论

此博客中的热门博文

我们应该满足欲望吗?——谈谈为什么感觉不到幸福

浅谈公民、国家、政府和政党的区别

should we satisfy our desire? Yes, it's justified