欢迎加入中国茉莉花行动部落

我们来自同一个家园,那里毒草丛生。
我们来自同一个部落,那里毒蛇横行。
我们播种茉莉,为了呼吸自由的芳香。
我们移植鲜花,为了拥抱春天的曙光。

Tuesday, May 5, 2020

用数学模型估算各国预期新冠死亡数,美国将高达24万!

本文网址:https://jasmine-action.blogspot.com/2020/05/blog-post_97.html



这是2020年5月5日世界各国(前16名)的新冠统计数据。根据这些数据,我们可以粗略估算各国最后的新冠死亡人数。

这里的数学模型,很简单,中学生水平就能懂得的。

简单地说,这里给出的公式是:

估算死亡率的公式是:

某国死亡率=某国死亡总数/(某国死亡总数+某国康复总数)

预期死亡总数1 = 已经死亡人数+死亡率 × 当前病中总数

全球平均死亡率 = 全球死亡总数/(全球死亡总数+全球康复总数)= 9.087%

预期死亡总数2 = 已经死亡人数 + 全球平均死亡率 × 当前病中总数

----------------------------------------

我们以Cn表示第n列的数字,这里的下面几列分别是:

列数       含义                全球目前有
C2      确诊总人数        3,724,518
C4      死亡总人数           258,027
C6      康复总人数        1,240,705
C7      病中总人数        2,225,786

在任何时候,都会有:

确诊总人数 = 死亡总人数 + 康复总人数 + 病中总人数

也就是:

C2 = C4 + C6 + C7

随着时间的发展,正生病的人,最后或者是死亡,或者是康复。那么,病中总人数C7(2,225,786人)每减少一个,就会使得(C4+C6)增加一个。

我们假设从现在开始,没有新病人增加。那么,过一个月后(往长点说,半年),这些正在观察的新冠病人(2,225,786人)将会是或者是死亡,或者是康复。

我们用X4来表示最终的死亡人数。那么,上面的表格将会演化为下面的形式:

列数       含义                    半年后期望值
  C2        确诊总人数         3,724,518
  C4        死亡总人数              X4
  C6        康复总人数         3,724,518 - X4
  C7        病中总人数              0


用R来代表确诊新冠病人中的死亡率。R可表示为:

R = C4 / (C4 + C6)

在这里,我们假设从确诊人数中,做随机抽样(C4 + C6),我们将C4和C6分别看成是这些随机抽样中的死亡者人数和康复者人数。

则预期死亡总数 X4 可表示为:

X4 = C4 + C7 * R = C4 * (1 + C7/(C6+C4))

用 A 来代表全球平均死亡率,A可以用全球的数字来估算:

A = ( C4/(C4 + C6)) = 1 /(1+1,240,705/258,026) = 17%;

用 Y4 来表示用平均死亡率来估算的预期死亡人数:

Y4 = C4 + C7 * A

注意X4和Y4计算方法的不同。X4是用该国的数据来估算死亡率,而Y4是用全球的数据来估算死亡率。

我们用X4和Y4的相应公式来计算出预期死亡人数如下:

国家                      Y4                 X4                 当前死亡人数

全球 World           636,410         641,226          258,027             
美国 USA             238,363         327,760            72,271
西班牙 Spain          37,704           35,588            25,613
意大利 Italy            46,054           54,515            29,315
英国 UK                 57,514            NA                 29,427
法国 France            41,219            55,634           25,531
德国 Germany        11,228              8,219             6,993
俄国 Russia            24,240            10,576             1,451


等等等等。这是我的粗略估算。对其它国家也可以做类似的估算。

当然,目前这种方式估算的死亡率偏高,这主要是前期的检测病人大多数重病病人,死亡率偏高。后来检测的大多数轻症病人。随着时间发展,按照上述方法计算的死亡率会逐渐减小。但发展到一定时间后,这个估算的死亡率会趋于稳定。

刘刚
2020年5月5日
------------------------

这是2020年5月10日世界各国的新冠统计数字。

我们用5月10日的新冠统计数字,算出的全球平均死亡率是:

A = 1 / (1 + 1,490,444/283,734)= 16%

按5月5日的数据来算,死亡率是17%。
按5月10日的数据来算,死亡率是16%。
这里计算的死亡率呈下降趋势。多算几次后,可以用外延插值法估算出比较准确的死亡率。

刘刚
2020年5月11日补充
---------------------------------

美国总统川普刚刚发推文 @realDonaldTrump:

For the constant criticism from the Do Nothing Democrats and their Fake News partners, here is the newest chart on our great testing “miracle" compared to other countries. Dems and LameStream Media should be proud of the USA, instead of always ripping us down!


川普推文链接:
https://twitter.com/realDonaldTrump/status/1257714716492722176

我回应川普推文的链接:
https://twitter.com/LiuGang8964/status/1257902774219571201

川普总统,你应该明白提高检测数丝毫不会降低将来的死亡人数!


深红爱国同盟 @23r0n3:

这个模型很简单
就是拿全球平均死亡率去乘确诊未愈的人
无非你多加了个初始值
这个模型的问题就在于死亡率(有的模型用死亡人数除总人数)
其实较小样本偏差很大
可以剔除掉
各国管控方式不一样
比如中国死亡率低是举国封城
也可以剔除
拿欧洲死亡率估算更合适
中国我预计是3600
后来修正了1500出来

刘刚:我不是假设死亡率为常数,而是假设 (死亡总数/康复总数)是常数。死亡总数和康复总数都是比较确定的数目。所以其比值会比较稳定。而总确诊数在很大程度上依赖于总检测数量,这就变得十分不确定,因为有很多感染的人并没有确诊。进而,正在生病(active cases)的人数也就不确定。所以,不管你用哪个数值作分母,死亡率都是很不稳定的。所以,假设(死亡总数/康复总数)是常数,比假设死亡率是常数,应该准确一些。因为总确诊数和正在生病的人数都依赖于检测数,我们不能用这两个数字来估算我们需要用的某些比例,如死亡率。

深红爱国同盟 @23r0n3:

事实上这个模型还是有问题
不同样本总数
在传染达到峰值或者说饱和值后
传染率会下降
初期会上升
应该是类似拉弗曲线
也就是说死亡率随时间变化是非线性的
这但是可以单独选取一些国家观察
然后拟合统一曲线模型

刘刚:我在文章中已经说了,我们假设没有新病人增加,就是假设没有传染了。我这里只是考虑已经确诊的人将会出现的死亡人数。这不存在传染问题。这种估算结果比较保守,就是实际预期死亡人数可能还会更多。

如果继续考虑有传染,那么预期死亡人数还会增加。

这里主要是如何估算死亡率。

很多人都用:

总死亡人数/总确诊人数

作为死亡率。但总确诊人数是依赖于检测人数的,检测人数完全依赖于人的意志,可大可小。这个死亡率是没什么意义。

也有人用:

总死亡人数/总人口数

作为死亡率。但目前的总死亡人数还在发展中,这个死亡率也在增加中。

我是用:

死亡率 = 总死亡人数 / (总死亡人数 + 总康复人数)

这个死亡率就是确诊人数中的死亡率。

但是,在总确诊人数中已经有部分人死亡了,部分人康复了,剩下的叫作 “病中的总人数”,就是

“病中的总人数” = 总确诊人数 - (总死亡人数 + 总康复人数)

将病中的总人数乘以死亡率,这就是那些还正在观察中的病人的预期死亡人数。

比如说,美国目前的还在观察中的新冠病人数是一百万。这一百万人最终不是死亡就是康复。目前按照 全球的

死亡率 = 总死亡人数 / (总死亡人数 + 总康复人数)= 0.17

来估算,美国就还要有17万人死亡,加上现有的7万,就是24万人最终死亡。

我这里用总死亡人数 和 总康复人数 来估算死亡率,是因为这两个数是不依赖于检测数的,而且是容易准确贯彻的数值。


No comments:

Post a Comment