人口学研究方法:规范与发展
什么影响,则很少有人涉及。从理论上说,取得同样的终身生育总量,可以有不同的进程表。即假定各队列的终身生育数量不变,从某一时期开始各队列的生育年龄开始推延,这一过程可以持续较长一段时期,直至最终稳定在一个新的生育模式上。我对此做过一些模拟计算,在这种情况下,生育模式转变时期中每年的TFR一定会低于事先所设的队列终身生育量,而这段时期两端及以外各年份的TFR则可以等于事先所设的终身生育水平。这表明,即使将整个转变过程或更长时期中各年的TFR都加在一起平均,得到的还是—个偏低的终身生育估计。
更普遍的情况是生育模式的变化与终身生育量的变化同时发生,这时TFR下降同时受这两个因素变化的影响,由生育模式变化导致TFR对终身生育水平的偏离便较难分析。
实际问题:实际工作需要不允许我们等很多年再提供真实队列终身生育统计,而现在只有TFR一种估计方法,并且我们知道TFR还会经常偏离队列终身生育水平,因此急需寻找一种更好的估计来取代它。否则尽管当前TFR的值虽然很低,即使不论统计失真问题,我们也不知道这是否仅仅反映TFR发生了负偏离,那么我们凭什么肯定生育率已经下降到更替水平了。我们又怎么能知道,当生育年龄推迟告一段落时,TFR向终身生育水平回归时会回升多少。要知道更替水平的真正概念是实际上某队列与其终身生育后代数量的比(注:从这个意义上,净人口再生产率等于1仅是一种时期估计的标准,并且也服从上述偏离,并不是真正的更替水平。)。
有关改进:Bongaarts和Feeney(1998)提出了去进度效应总和生育率(TFR')。该方法旨在提供一种根据时期数据对终身生育水平的较好估计(注:Bongaarts和Feeney(1998)警告说,这一方法不适用于那种特殊时期效应(即重大灾害等)的年份。)。郭志刚(2001)对此进行了介绍,并用中国多年生育数据对该方法进行了检测和评价,结果是TFR'作为终身生育水平的估计的确大大优于TFR(注:郭震威(2000)认为TFR'不伦不类,既不是时期生育指标,又不是终身生育指标,是个尴尬的指标。我认为,它只是应实际需要而产生的另一种根据时期生育信息对终身生育水平的新估计而已,其实这没有什么可尴尬的。统计中凡是不能直接测量的时候,都得采用估计来代替。真正有意义的问题是,它是否比传统TFR更接近于终身生育水平。)。
该方法基本原理可以这样来理解:现实中生育模式转变时,除了导致该年生育数量有所变化以外,还会有其他共生现象,如分孩次的平均生育年龄(MACi)也会变化(注:Bongaarts和Feeney(1998)强调要用分孩次的平均生育年龄,而不能用总的平均生育年龄,因为后者会抹煞实际变化。)。MACi实际上是生育模式转变的测量值,可以在理论上建立其变化量与时期生育变化量之间的函数关系。TFR'便是在常规分孩次TFR(i)的基础上利用MACi的变化信息来调整,得到去进度效应的分孩次TFR'(i),然后再汇总为TFR'。经过调整,TFR'可以在相当程度上修正TFR距终身生育水平的偏离,因此TFR'更接近于队列终身生育水平(这里队列仍是泛指的)。也就是说,我们可以用TFR'来替代TFR原来所承担的终身生育估计的功能,而TFR还可以继续承担描述时期生育水平的功能,TFR'与TFR之差可以作为生育推延对当前生育水平影响的估计(注:我曾当面请教Bongarts,问TFR'方法是否可应用于预测模拟,他毫不犹豫地回答说不能。)。
我认为,尽管TFR'指标还有继续改进的余地(注:比如某一年的MACi的计算还要前一年和后一年的数据,因而多少丧失了一点及时性。然而,我自己曾尝试过另外的计算,比如只用前一年和当年两年的信息,调整的结果也并不差。),但显然Bongarrts和Feeney为解决这一估计问题指出了极富于科学价值的方法论途径。并且,这一新指标不仅可以用于监测队列终身生育水平,也可以用于分析以往的生育数据(郭志刚,2000),帮助我们更好地理解我国的生育转变史和计划生育史。
3 缺陷二:总和生育率不能控制育龄妇女的孩次结构
对某些重要因素进行统计控制可以为不同年份或不同地区的比较提供更大的可比性。尽管TFR控制了育龄妇女的年龄结构,但是它并没有控制育龄妇女的孩次结构。然而,当前许多人口模拟研究都不能再忽略育龄妇
问题的表现:实际上生育过程是严格的递进事件,也就是说,只有未生育者才能生育一孩,只有生育过一孩且尚未生育二孩者才能生育二孩。而常规生育率则是以年龄别所有妇女总数作为基数,因而没有容纳育龄妇女的曾生孩次信息,也就不能控制曾生孩次这种结构影响。因此,比较孩次结构差别较大的年份或地区之间的年龄别生育率(或TFR),便不能区分其差异到底是出于生育水平不同还是出于孩次结构不同。当其用于人口预测模拟时,如果假定两地区育龄妇女年龄结构相同,同样的系列生育率的假设会导致孩次结构十分不同的地区(代表着不同生育政策类型)将会有相同的出生人数,显然这严重地偏离实际情况。因此,面对当前的许多研究需要,基于年龄别生育率的TFR方法无论是用于比较分析上还是用于预测模拟,都会影响其结果的有效性(注:至于分孩次的年龄别生育率,只是对分子(即出生)划分了孩次类别,但是并没有对育龄妇女本身划分孩次结构。其基数没有控制孩次结构,因而从本质上说也没有控制孩次结构。)。
替代方法的产生:实际上,计划生育采取了分类指导原则后,便产生了多种生育政策类型,其显著特征便是孩次控制上的不同。在不同地区实施不同政策时,育龄妇女的孩次结构便取得了越来越重要的意义。从这一角度出发,导致Feeney(1985)和马瀛通等(1986)分别以不同思路创建了孩次递进生育指标体系。
他们的共同点在于采用孩次递进比作为生育测量的基础来构建指标体系。如前所述,每年的出生可以划分孩次。如果再将某一群体生育指标的基数由对应口径的年中妇女总数换成年初对应(即前一)孩次妇女时,便称为孩次递进比(注:实际上可理解为一种概率,如本年年初某年龄组(或孩次间隔组)只有一孩的妇女中在本年生育二孩的比例。)。然后,还可以将孩次递进比换算成递进总和生育率。
Feeney的模型突出地考虑了孩次递进间隔因素,不考虑年龄结构,因而常被称为间隔递进模型。而马瀛通等的模型则突出地考虑了年龄递进因素,因此常被称为年龄递进模型。
这两种方法不仅可用于在控制妇女孩次结构条件下的比较分析,也可以用于预测模拟(注:应该指出,其实中国人民大学人口研究所的老一辈人口学家早在1970年代所自行创建的标准(或可变)生育率预测法中也已经包含了控制孩次结构影响的思想(刘铮、邬沧萍、查瑞传,1981)。)。递进方法不仅可以在预测中控制孩次结构,而且应用于模拟预测时实际上比常规生育率方法更方便(注:这里的方便指,它只需要每年期初妇女的孩次别人口数便可以直接乘以递进比便得到对应的生育量,而不需要再计算其中妇女人数。)。由于递进比的概率性质,还能根本避免孩次别总和生育率出现的那种超过1的现象(注:尽管如此,Bongaats和Feeney(1998)认为这一类应用生命表方法的生育指标仍然没有真正控制生育进程变化的影响。)。
主持人评论
本期论坛邀请的三位专家都有多年从事人口统计和数据分析的经验,对人口学研究方法有很深的造诣。王谦副司长通过从多年工作中积累的大量实例,分析了在人口和计划生育工作中经常发生的统计方法和统计数据被误用的情况;郑真真副教授则对统计分析中比较常见的问题进行丁独到的分析和总结;郭志刚教授对总和生育率指标进行了深入全面的剖析,分析了其内在缺陷和改进方法。
王谦副司长通过10个典型实例说明在人口和计划生育实际工作中,统计方法和统计数据在五个方面经常被误用。这五个方面的问题有些属于统计分析中容易犯的错误,带有普遍性,如,错误地解释变量之间的因果关系,在统计分析中忽视定性分析与定量分析的关系,结论不是由统计 《人口学研究方法:规范与发展(第4页)》
本文链接地址:http://www.oyaya.net/fanwen/view/161952.html
更普遍的情况是生育模式的变化与终身生育量的变化同时发生,这时TFR下降同时受这两个因素变化的影响,由生育模式变化导致TFR对终身生育水平的偏离便较难分析。
实际问题:实际工作需要不允许我们等很多年再提供真实队列终身生育统计,而现在只有TFR一种估计方法,并且我们知道TFR还会经常偏离队列终身生育水平,因此急需寻找一种更好的估计来取代它。否则尽管当前TFR的值虽然很低,即使不论统计失真问题,我们也不知道这是否仅仅反映TFR发生了负偏离,那么我们凭什么肯定生育率已经下降到更替水平了。我们又怎么能知道,当生育年龄推迟告一段落时,TFR向终身生育水平回归时会回升多少。要知道更替水平的真正概念是实际上某队列与其终身生育后代数量的比(注:从这个意义上,净人口再生产率等于1仅是一种时期估计的标准,并且也服从上述偏离,并不是真正的更替水平。)。
有关改进:Bongaarts和Feeney(1998)提出了去进度效应总和生育率(TFR')。该方法旨在提供一种根据时期数据对终身生育水平的较好估计(注:Bongaarts和Feeney(1998)警告说,这一方法不适用于那种特殊时期效应(即重大灾害等)的年份。)。郭志刚(2001)对此进行了介绍,并用中国多年生育数据对该方法进行了检测和评价,结果是TFR'作为终身生育水平的估计的确大大优于TFR(注:郭震威(2000)认为TFR'不伦不类,既不是时期生育指标,又不是终身生育指标,是个尴尬的指标。我认为,它只是应实际需要而产生的另一种根据时期生育信息对终身生育水平的新估计而已,其实这没有什么可尴尬的。统计中凡是不能直接测量的时候,都得采用估计来代替。真正有意义的问题是,它是否比传统TFR更接近于终身生育水平。)。
该方法基本原理可以这样来理解:现实中生育模式转变时,除了导致该年生育数量有所变化以外,还会有其他共生现象,如分孩次的平均生育年龄(MACi)也会变化(注:Bongaarts和Feeney(1998)强调要用分孩次的平均生育年龄,而不能用总的平均生育年龄,因为后者会抹煞实际变化。)。MACi实际上是生育模式转变的测量值,可以在理论上建立其变化量与时期生育变化量之间的函数关系。TFR'便是在常规分孩次TFR(i)的基础上利用MACi的变化信息来调整,得到去进度效应的分孩次TFR'(i),然后再汇总为TFR'。经过调整,TFR'可以在相当程度上修正TFR距终身生育水平的偏离,因此TFR'更接近于队列终身生育水平(这里队列仍是泛指的)。也就是说,我们可以用TFR'来替代TFR原来所承担的终身生育估计的功能,而TFR还可以继续承担描述时期生育水平的功能,TFR'与TFR之差可以作为生育推延对当前生育水平影响的估计(注:我曾当面请教Bongarts,问TFR'方法是否可应用于预测模拟,他毫不犹豫地回答说不能。)。
我认为,尽管TFR'指标还有继续改进的余地(注:比如某一年的MACi的计算还要前一年和后一年的数据,因而多少丧失了一点及时性。然而,我自己曾尝试过另外的计算,比如只用前一年和当年两年的信息,调整的结果也并不差。),但显然Bongarrts和Feeney为解决这一估计问题指出了极富于科学价值的方法论途径。并且,这一新指标不仅可以用于监测队列终身生育水平,也可以用于分析以往的生育数据(郭志刚,2000),帮助我们更好地理解我国的生育转变史和计划生育史。
3 缺陷二:总和生育率不能控制育龄妇女的孩次结构
对某些重要因素进行统计控制可以为不同年份或不同地区的比较提供更大的可比性。尽管TFR控制了育龄妇女的年龄结构,但是它并没有控制育龄妇女的孩次结构。然而,当前许多人口模拟研究都不能再忽略育龄妇
女的孩次结构问题,否则会有损其研究结果的有效性(注:比如,与调整生育政策相联系的人口模拟如果忽略现有一孩的妇女人数,便无法计算由于多年积累在一孩的这批妇女在政策调整时将产生的特殊生育效应。另外,有关生育政策后果方面的研究(如四二一家庭结构)也有类似问题。)。
问题的表现:实际上生育过程是严格的递进事件,也就是说,只有未生育者才能生育一孩,只有生育过一孩且尚未生育二孩者才能生育二孩。而常规生育率则是以年龄别所有妇女总数作为基数,因而没有容纳育龄妇女的曾生孩次信息,也就不能控制曾生孩次这种结构影响。因此,比较孩次结构差别较大的年份或地区之间的年龄别生育率(或TFR),便不能区分其差异到底是出于生育水平不同还是出于孩次结构不同。当其用于人口预测模拟时,如果假定两地区育龄妇女年龄结构相同,同样的系列生育率的假设会导致孩次结构十分不同的地区(代表着不同生育政策类型)将会有相同的出生人数,显然这严重地偏离实际情况。因此,面对当前的许多研究需要,基于年龄别生育率的TFR方法无论是用于比较分析上还是用于预测模拟,都会影响其结果的有效性(注:至于分孩次的年龄别生育率,只是对分子(即出生)划分了孩次类别,但是并没有对育龄妇女本身划分孩次结构。其基数没有控制孩次结构,因而从本质上说也没有控制孩次结构。)。
替代方法的产生:实际上,计划生育采取了分类指导原则后,便产生了多种生育政策类型,其显著特征便是孩次控制上的不同。在不同地区实施不同政策时,育龄妇女的孩次结构便取得了越来越重要的意义。从这一角度出发,导致Feeney(1985)和马瀛通等(1986)分别以不同思路创建了孩次递进生育指标体系。
他们的共同点在于采用孩次递进比作为生育测量的基础来构建指标体系。如前所述,每年的出生可以划分孩次。如果再将某一群体生育指标的基数由对应口径的年中妇女总数换成年初对应(即前一)孩次妇女时,便称为孩次递进比(注:实际上可理解为一种概率,如本年年初某年龄组(或孩次间隔组)只有一孩的妇女中在本年生育二孩的比例。)。然后,还可以将孩次递进比换算成递进总和生育率。
Feeney的模型突出地考虑了孩次递进间隔因素,不考虑年龄结构,因而常被称为间隔递进模型。而马瀛通等的模型则突出地考虑了年龄递进因素,因此常被称为年龄递进模型。
这两种方法不仅可用于在控制妇女孩次结构条件下的比较分析,也可以用于预测模拟(注:应该指出,其实中国人民大学人口研究所的老一辈人口学家早在1970年代所自行创建的标准(或可变)生育率预测法中也已经包含了控制孩次结构影响的思想(刘铮、邬沧萍、查瑞传,1981)。)。递进方法不仅可以在预测中控制孩次结构,而且应用于模拟预测时实际上比常规生育率方法更方便(注:这里的方便指,它只需要每年期初妇女的孩次别人口数便可以直接乘以递进比便得到对应的生育量,而不需要再计算其中妇女人数。)。由于递进比的概率性质,还能根本避免孩次别总和生育率出现的那种超过1的现象(注:尽管如此,Bongaats和Feeney(1998)认为这一类应用生命表方法的生育指标仍然没有真正控制生育进程变化的影响。)。
主持人评论
本期论坛邀请的三位专家都有多年从事人口统计和数据分析的经验,对人口学研究方法有很深的造诣。王谦副司长通过从多年工作中积累的大量实例,分析了在人口和计划生育工作中经常发生的统计方法和统计数据被误用的情况;郑真真副教授则对统计分析中比较常见的问题进行丁独到的分析和总结;郭志刚教授对总和生育率指标进行了深入全面的剖析,分析了其内在缺陷和改进方法。
王谦副司长通过10个典型实例说明在人口和计划生育实际工作中,统计方法和统计数据在五个方面经常被误用。这五个方面的问题有些属于统计分析中容易犯的错误,带有普遍性,如,错误地解释变量之间的因果关系,在统计分析中忽视定性分析与定量分析的关系,结论不是由统计 《人口学研究方法:规范与发展(第4页)》