三 本项研究的基本数据

家庭结构及其变动研究无论是描述性分析还是影响因素分析均应以数据资料为基础。本项研究仍秉持这一原则。与以往研究的不同之处在于,本书力求把具有整体分析优势的人口普查数据与针对家庭结构状态和变动的专项调查数据结合起来。

(一)关于第六次人口普查数据

我们以往对家庭结构做整体分析时,所依据的主要是1982年1%抽样数据库数据、1990年1%抽样数据库数据和2000年1%长表抽样数据库数据。按照原来设想,本项研究也将以2010年1%长表抽样数据库数据为“宏观”分析的基本资料。但最终从国务院人口普查办得到的是表格数据,原来的研究内容和分析视角受到限制。后来国务院人口普查办允许课题组自己编程,在其原始数据库中运行,最终得到20个与本项研究有密切关系的表格数据。但必须承认,与数据库数据相比,这些表格数据虽然满足了课题的基本需求,但具体分析过程和角度受到了一定制约,以致内容安排不得不有所收缩。

人口普查数据,特别是2000年“五普”和2010年“六普”所增加的长表1%人口抽样调查对家庭结构分析的扩展具有很大的帮助作用。但其不足之处在于,只有64岁及以下妇女才有子女信息,这对研究65岁及以上老年人的居住方式与子女数量的关系构成约束。还有,该数据仅包含调查时在户内和出外时间不超过半年的成员的信息,离开户内半年以上者仅有数量说明,性别、年龄、婚姻状况、职业等信息都付之阙如,难以据此对人口迁移流动对家庭结构的影响进行深度分析。另外,人口普查以共同生活成员所组成的家庭户为调查和统计对象,不在户内生活的子女等关系密切的直系成员和配偶则不涉及,难以把握同一网络家庭成员的同地和异地居住状况。

(二)“七省区家庭结构和代际关系调查”数据

为弥补人口普查数据在家庭结构研究方面的不足,我们进行了一项以城乡家庭结构和代际关系为考察对象的专项调查(为与“六普”数据匹配使用,该调查于2010年10月前后进行)。课题组采用标准组群抽样方法(Probability Proportion to Size, PPS法),结合各地经济、社会和人口等指标,首先进行省级单位一级抽样,得到50个抽样结果。在此基础上,考虑区域代表性和调查组织落实的可行性,最终选取河北、吉林、浙江、安徽、广东、陕西和广西作为调查实施地区。在省级单位内,我们仍采用PPS方法,各抽取6个区/县形成区/县方案。初选出9个备选方案,选择一个作为最终区/县级的调查方案。在抽中的区/县依据其下辖所有社区和乡镇村的家庭户数和人口数,通过随机方法抽取5个村庄和社区,每个区/县给出3个备选方案供委托调查单位采用。每个村庄和社区随机调查20户(每户一份问卷)。每个省级单位入户调查不低于630户。本项调查于2010年10~12月进行,最终获得有效问卷4425份。

鉴于人口普查数据调查项目较少,难以对家庭结构影响因素进行较全面的分析,在“七省区家庭结构和代际关系调查”问卷中,我们不仅增加了不同年龄组已婚受访者生育、存活子女数量和子女居住地等方面的内容,而且对家庭“裂变”的过程和方式,亲子分爨、兄弟分家所形成的“网络家庭”之间的关系等加大了调查力度,以便从“家内”和“家际”结合的角度认识城乡家庭结构的最新变动。

由于“七省区家庭结构和代际关系调查”与人口普查进行于同一年份,因而两者的数据信息对研究对象的解释将具有一定的互补性。