2018年10月10日,美国圣路易斯华盛顿大学郭申阳教授受邀来中国人民大学社会与人口学院人口学系开展了一场题为《倾向值分析:前沿方法及争论》的学术讲座,讲座由学院杨凡副教授主持,来自学院的老师及学生共50余人参加了本次讲座,现场座无虚席,非常火爆。
郭申阳教授首先介绍了倾向值分析在实证研究中的必要性,特别是在当前大数据、机器学习、社会计算、人工智能活跃的时代,研究者更有必要用理论来检验开发出来的研究假设。基于此,郭教授的报告主要分为三个部分:一是介绍倾向值分析的方法;二是探讨了King和Nielson的近期研究;三是阐述了学界在倾向值使用中的争论。
郭教授提出,统计学家在因果模型开发方面的主要工作是控制筛选的误差、解决内生性的问题,目前的方法主要有工具变量法、时间序列法、贝叶斯方法、断点回归法、有向无循环图等等,而倾向值分析法近年来开始逐渐替代上述方法,越来越多的为研究者所采用。郭教授对学界在倾向值使用中的一些误区进行了探讨,对两个易混淆的命题进行了再辨析,一是相关不等于因果、二是自相关不等于内生性。他强调,倾向值分析的目的一是要把筛选误差控制住、二要通过对回归做进一步处理来解决内生性问题,以更好地使用观察数据。目前关于倾向值分析的方法主要有样本选择法、优化匹配法、一般的倾向值分析方法、干预效应法、匹配估算法、非参数回归法、内核匹配+局部线性回归法等。随后,郭教授给学院师生分享了他和学生近期的一项研究,用实验将十种处理内生性的方法做了模拟对比,并分析每种方法的优劣,郭教授认为确定一种最好的方法很难,希望大家尽量在多种方法中寻求平衡。
与会师生围绕郭教授讲座主题展开了热烈的讨论,其中李婷老师谈到,在实际应用中一些很难测量的遗漏变量如何被倾向值分析法解决?以及倾向值匹配与敏感性分析之间有什么关系等,郭教授一一给与了回应,他提出倾向值分析法是对明显的选择性误差给出控制,如果是遗漏的变量还是无法用纯随机的方法来解决,希望大家能用多种倾向值的方法来证明研究结果,因为综合使用本身就是一种敏感性分析。
最后,杨凡老师对会议作了总结并向郭教授表示诚挚感谢,郭教授表示,希望大家一起使用和推动倾向值分析方法的进步和完善,也希望将来通过多种方式进一步加强跟人口学系的交流合作。
报告人简介:
郭申阳,圣路易斯华盛顿大学终生教授、Frank J Bruno 杰出教授、负责大中国国际事务助理副校长, “美国社会福利与社会工作科学院”院士(2014年入选), Sage 出版社“社会科学高级定量技术系列”主编。他是美国社会统计方法领域的知名学者。他与Mark Fraser合著的《倾向值分析》(2010,2014)是系统介绍倾向值方法的第一部专著。他在动态分析、项目评估、因果统计分析模型,青少年心理干预、社会福利政策等领域已发表论文和专著近100篇。