所有研究三年自然灾害人口问题的人都面临这样两个问题:
第一个问题是:年鉴1960年年末人口比1959年少了1000万,第二年又比1960年少了348万。也就是仅仅年末人口就直接减少1348万。一般来讲出生人口总是多于死亡人口,因此怀疑这两年非正常死亡人数应该不少于1348万。但是,国家统计局通常提供两列数字,一列是历年年末人口,一列是历年出生率、死亡率和自然增长率。按照国家统计局提供的计算方法,用年中人口乘以自然增长率,得出的数字与年末人口相减得出的数字明显不同。比如按自然增长率计算,1960年年末人口比1959年减少的数字不是1000万而是305万,1961年不是减少348万而是增加250万。
第二个问题是:如果把五十年代初到七十年代末历年的人口净增长数量用年末人口相减和自然增长率计算两种方法做一个图,会发现两条曲线基本不相关。1956年到1959年按年末人口相减得出的增长人口总是大于按自然增长率计算的人数,而且偏差能达到数百万。到1959年积累到1000多万。而1960年开始直至1978年则相反,也动辄一年偏差数百万。两条曲线到七十年代末回归到接近水平,而且自此不再出现偏差。(见图一)
图一:自然增长率计算与年末人口相减的净增人口的偏差[1]
这种情况使所有研究者必须面对两个问题:
首先:究竟哪一列数字更接近真实。
其次:既然两列数字在这个时期完全不相关,那么统计局提供的计算公式有些就不是等式,而是不等式。比如:
上年年末人口-年末人口≠年中人口×自然增长率
既然是个不等式,那么在计算中就不能应用。也就是假如选用这个公式以及这个公式推导出来的公式,不能得出有价值的结论。
其实这个问题也是国家统计局发愁的问题。为什么会出现这种情况呢?这与当时的统计方法自身缺陷,统计手段不完善造成的。
年末人口数的来源是公安部门的户籍统计人数逐级上报汇总数字。出生率、死亡率和增长率是实际统计死亡、出生数逐级上报的汇总数字。连个数字来源不同,对不上是正常的。
这个问题在第三次人口普查时解决了。普查当年的数字是同一来源,因此肯定照应得上。此后各年做千分之一人口抽样调查,得出出生、死亡率,用这个数计算出年末人口。来源一致,每年的净增人口也会相等。每10年的普查做些调整。
但是,此前的统计就算不可能完全相等,但总是同一个事件的统计,数字偏差不该这么大,尤其是不该一个时期向正方向大幅偏差,另一个时期向负方向大幅偏差。这就提出一个问题:既然出现这种情况,一定是实际发生了一个事件,这个事件决定了这个偏差。但是,究竟是什么事件呢?国家统计局和公安部的工作人员长期没解决,他们自己也很疑惑。
这个问题被徐州师范大学数学教授孙经先先生解决了。孙教授是这样思考的:
在全国人口系统中,按规范计算,年末人口-上年年末人口=出生人口-死亡人口=年中人口×自然增长率。但是,在子系统中,年末人口-上年年末人口≠出生人口-死亡人口≠年中人口×自然增长率。因为子系统存在人口迁徙情况。也就是说,每个子系统是:
年末人口-上年年末人口=出生人口-死亡人口+迁入人口-迁出人口。或者=年中人口×自然增长率+迁入人口-迁出人口
如果母系统总计有两个子系统,那么:
上年年末人口-年末人口(母系统)=[出生人口-死亡人口+净迁入人口(子系统一)]+[出生人口-死亡人口+净迁入人口(子系统一)]。
但是,假如这个等式变成了不等式,那么最大可能是两个子系统迁出和迁入人口不对应。比如,子系统一净迁入500万,而子系统二净迁入只有-300万,自然会形成一个不等式。
实际会不会发生这种情况呢?孙教授很敏锐地注意到这个时期国家统计局还公布了第三组数字:城镇居民自然增长率和农村居民自然增长率。由此可以计算出两组群体分别的迁徙情况。基本方法是:
(城镇或农村)净迁入人口=上年年末人口-年末人口-年中人口×自然增长率
如果城镇净迁入人口与农村净迁入人口数相加接近零(不可能完全相等),那么说明用户籍统计方法得出的年末人口数不存在问题,是接近真实的。但如果不相等呢?那就看偏差情况与前面显示的偏差情况相关系数有多大了。
孙教授用年鉴数字进行计算后,得出这样一个结果(具体计算省略,如果需要验算见表一、图二)
表一:用年末人口与增长率计算的偏差和户籍登记偏差
图二、1956-1966年两组偏差曲线对比
上表清晰显示,自然增长率计算的净增人口与年末人口计算的净增人口的偏差度,与户籍登记计算的净增人口与年末人口计算净增人口的偏差度基本重合,高度相关。这说明用自然增长率计算的净增人口与年末人口计算的净增人口的偏差,是因为按城乡户籍登记的年末人口因漏报、重报等问题未能准确反映人口真实情况,而按自然增长率计算的净增人口更接近真实人口数字。
那么更接近1956-1966年实际数字的年末人口数字应该是:
任何用公式计算得出的结果,必须与实际情况相符,否则没有意义。那么,是不是在1960年前后和1956年到七十年代末发生过相当数量的人在一个时期重报、虚报了户口,另一个时期漏报了户口呢?如果对照历史会发现,确实如此。
1956年开始中国进入工业化高潮,大量农民被招工为市民。到1960年底城镇户口总计增加了4788万。扣除自然增长人口,有3000多万农民成为市民。在这个过程中,发生离开农村但没有被注销户口和虚报户口的情况是存在的。因为当时刚实行城乡分离的户籍制度,农民不习惯严格的户籍管理。同时,当时已经实行计划经济,布票、煤油票等票证开始计划供应。这都会造成每年数十万到数百万的重报、虚报户口情况。
由于我国经济遇到困难,从1960年9月起,开始启动精简市镇人口的工作,合计约有1000万左右的人以各种形式由市镇下放和精简到农村。到1963年累计涉及2000万人。这些人中有许多人的户籍迁出市镇,但是没有在当年办理农村户籍迁入手续。或者虽然被注销户口,但人并未离开城市。因为当时农村情况非常差,连农民自己还大量逃荒和迁徙到新疆等边缘地区。这就造成相反情况,即大量漏报或无法统计到的人口大量出现。上述分析与很多对这个时期的回忆录中都有记载。孙经先教授的这个研究解决了国家统计局几十年没有解决的问题。负责第三次人口普查的国家统计局李成瑞原局长听过孙教授对这个研究的汇报,认为符合情况。
这样看,《中国共产党的七十年》和党史二卷中“1960年全国总人口比上年减少1000万”的文字就需要重新考虑了。
现在回到开始讲到的“不等式”问题。贫道研究了所有认为这个时期非正常死亡人数在3000万到7000万的文章,注意到大部分研究都是用不等式得出结论的。这本身就不符合统计规范,属于无效结论(当然,还有挑选数字等不符合规范的)。孙经先教授的研究提供了一个新的研究环境,起码让他们没有了造假的借口。
当然,孙教授的研究并没有结束。因为如果自然增长率计算的年末人口更加准确,那么就必须从偏差起始年,用调整后的数字确定年中人口[(上年年末+年末)/2],最后回归到一条线上。只有这样才能提供一个研究1955-1978年人口变动情况的基础数据。当然,这个研究还会参考第三-第六次人口普查数字、历史上特殊时期人口统计的规律,以及人口增长的可能性范围等,使数字更接近真实。最后会提供一个比较全面的分析三年自然灾害期间人口减损情况的研究报告。大家可以期待,不会很长时间的。在书出来前贫道会把一些阶段性成果写点帖子。其实前几天就透露了点。哈哈。
事在人为,有些事儿看着很难。只要记住毛主席的话:“世上怕就怕认真二字,共产党就最讲认真”、“世上无难事,只要肯登攀”。
[1] 图表来源:孙经先《破解国家统计局户籍统计数据矛盾之谜——关于我国六十年代人口变动问题》。
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】