姓氏分布与人口迁移
陈家伟 《 光明日报 》( 2014年11月19日 15 版)
在研究人口迁移方面,中国姓氏有着得天独厚的优势。一方面,中国是世界上最早使用姓氏的国家,由于受儒家文化影响,中国人一般不会改姓,这使得中国姓氏的传递具有很好的稳定性和可靠性。另一方面,中国地域广阔,行政区划层级丰富,具有很好的空间分辨率,特别适合将姓氏分布与地理信息相结合,研究人口迁移的相关问题。
以姓氏分布为基础,利用不同空间尺度的系统分析,配合运用指标分析、聚类分析、因素分析等社会统计学的研究方法,可以探讨与人口迁移相关的许多问题,如大规模的人口迁移事件、地理隔离对群体结构的影响、人口迁移率的计算等,为研究人口迁移问题提供新的视角。
姓氏分布与大规模人口迁移
大规模的人口迁移会增加迁入地的姓氏多样性,导致迁入地和迁出地的姓氏分布呈现较高的相似性,因此,通过考察不同地区姓氏分布的特点,能够判断哪些地区曾发生过大规模的人口迁移,从而为史料中记载的人口迁移事件提供佐证。我们利用全国12.8亿人的姓氏数据,根据同姓率和姓氏距离两个指标,对我国历史上出现的一些大规模人口迁移事件进行了分析。
同姓率的概念最早由达尔文提出,用来估算近亲结婚的比例,其意指是在一个地区随机选取两个人,而他们具有相同姓氏的概率。显然,一个地区的姓氏数量越多,每个姓氏的人数越平均,同姓率就越小,说明该地区有较好的姓氏多样性,很有可能是人口的迁入
地。对比我国的各个地区,可以发现,长江中下游地区有较低的同姓率和很好的姓氏多样性,这与北宋南宋时期大量移民从黄河流域迁移到长江流域的史实是一致的。相反,在某些比较隔绝的少数民族聚居区,遗传漂移占主导作用,导致姓氏比较单一,例如甘肃省广河县的20多万人口中有17万人姓马,同姓率很高。而同样是少数民族聚居地的嘉峪关、曲靖等城市,由于历史上曾经作为物质和文化交流的中心,吸引了大量外来人口,其同姓率比普通城市还低。
姓氏距离是在地区间同姓率的基础上得到的,反映的是每一个姓氏在不同地区所占人口比例的相似程度,相似性越高,姓氏距离就越小,说明两地之间可能存在人口迁移。在省级层次上,我们通过聚类分析发现东北三省和山东虽然隔着北京、天津、河北等省份,但他们的姓氏距离却最小,这反映了“闯关东”的社会移民现象。姓氏距离还能考察城市之间的移民现象,比如新疆石河子市,与中原地区很多城市的姓氏距离远小于其与周围地区的姓氏距离,这是因为石河子的大部分人口是来自河南、安徽、陕西、江苏等地的支边建设者。
姓氏空间分布与地理隔离
地理隔离是指由于某些地理条件的阻隔而形成的隔离,使生物不能由一个地区自由迁到另一个地区,从而阻止了基因的交流。地理隔离增强了遗传漂移的作用,不仅导致不同地区的人们在肤色、体质、体貌、血型等生物学方面存在明显差异,而且促使不同地区形成独特的观念、宗教、方言、习俗等文化传统,这些文化因素进一步阻碍了人口的迁移和交流,使得不同地区占优势地位的姓氏各有不同,增大了地区间姓氏分布的差异。通过分析姓氏空间分布的特点,能够探讨出我国地理隔离的状况。
总的来说,姓氏距离一般随地理距离的增加而增加,两者存在正相关,而相关性的大
小可以反映地理隔离的程度。以美国为例,由于美国社会流动性强且交通便捷,人口迁移率一直处于世界前列,频繁的人口迁移导致姓氏的空间分布趋于均匀,姓氏距离和地理距离的相关系数只有0.17。而大部分的欧洲国家保持着传统的定居生活方式,两者的相关系数基本在0.4以上,德国为0.51,法国达到了0.61。根据2007年的人口姓氏分布数据,在省级层次上,我国地理距离和姓氏距离之间的相关系数为0.64,表现出明显的地理隔离,反映了我国居民以定居为主的居住习惯。
局部来看,我国不同地区的地理隔离程度也存在明显差异,这可以通过分析一个地区与周围地区姓氏距离和地理距离的关系来考察。分析表明:北方的大部分城市,与周围城市的姓氏距离都很小,以北京为例,在其周围800公里的范围内,姓氏距离基本没有明显变化,超过1000公里才有明显增加,这说明北方地区的地理隔离不显著。而以福建、广东为代表的大部分南方城市则大不相同,姓氏距离随地理距离的增长很快,说明这些地区的地理隔离十分显著。
绘制某个城市与周围城市之间姓氏距离与空间距离的关系曲线,根据曲线的均值、斜率、转折点等可以对城市的聚居程度、隔离程度、迁移半径等给出定量化的描述,有利于我们更加全面地刻画城市的迁移特征。根据城市之间的姓氏距离,可以进一步探测中国人口的地理隔离边界,并寻找引起地理隔离的自然人文因素,能够为区域边界的划分、民族政策的制定以及社会治理方案的提出提供科学依据。
姓氏分布变化与人口迁移率的计算
随着科技的进步与社会经济的发展,人口流动越来越频繁,但地区间人口迁移率的计算尤其是长时期内人口迁移率的估算却比较困难,主要原因是统计口径和方法的变化以及历史数据的缺乏。利用相对容易获得的姓氏数据,使用一定的统计方法,不仅可以得到每
个地区在一段时间内人口迁入和迁出的总量,还可以推断出迁入人口来自哪里以及迁出的人口去往何处,这不论在人口学还是社会管理领域都具有重要的应用价值。
目前,利用姓氏分布计算人口迁移率基本有两种方法:一种方法仅仅需要单个时间点的姓氏分布情况,根据中性理论,得到姓氏数量、人口数量、人口迁移率之间的关系,进而计算出地区的人口迁入率。美国科学院院士、著名群体遗传学家卡瓦利·斯福扎使用这种方法估算了意大利91个省的人口迁入率,和人口普查结果具有明显相关性。另一种方法是根据两个时间点各个地区姓氏分布的变化,用统计学方法得到地区间的人口迁移率。利用这一研究线路,卡瓦利·斯福扎计算了撒丁岛九个地区之间1871年—1970年间的人口迁移矩阵;还有学者计算了巴黎和周围某些地区之间的人口迁移率,其结果都与实际数据有很好的对应。
我们利用1982年全国第三次人口普查万分之五的抽样数据,以及2007年全国人口的户籍数据,计算了该时期省际之间的人口迁移率,但结果并不理想,这是因为1982年的数据是由300多个调查点的数据加总而成,而中国人同姓聚居的特点使得每个省十几个调查点的数据并不能反映真实的姓氏比例。利用我国人口普查的完整数据或者某两个时间点的各地区的户籍数据,就能克服因数据抽样导致的误差,从而比较准确地计算该时期内地区间的人口迁移率,为我国制定人口政策提供依据。
(作者单位:北京师范大学系统科学学院)
因篇幅问题不能全部显示,请点此查看更多更全内容