1、PSM应用主要考虑如下情形 2、匹配变量选择 3、匹配方法 4、匹配步骤 5、PSM的特点 6、PSM的优点 7、PSM的局限性 一、背景介绍 倾向性评分的基本原理是用一个分值来替代多个协变量,均衡处理组和对照组间协变量的分布。对非随机化研究中的混杂因素进行类似随机化的均衡处理,减少选择偏倚。计算得出PS分值后,可...
PSM可以结合双重差分模型(DID)使用,形成PSM-DID模型,以处理更为复杂的因果推断问题。例如,在政策评估中,PSM-DID模型可以帮助研究者识别政策实施前后的变化,同时控制其他变量的影响,从而更准确地估计政策效应。在实际应用中,PSM需要仔细选择协变量,并进行匹配效果的检验,以确保匹配后的样本在关键变量上达到平衡。
倾向性得分匹配 倾向性得分匹配(Propensity Score Matching,PSM)目前是观察设计中应用较为广泛的一种方法,由于基于离线数据就可以展开相关分析,在业内也较受喜欢,PSM的基本框架可以分为以下四步: 1、计算所有单位的倾向得分 2、根据某种匹配策略将干预组与对照组进行匹配 3、检查协变量是否平衡,如果不平衡,则使用替代...
当然我们在获得倾向性得分后,除了匹配,还可以通过加权、分层或回归校正等方法来控制混杂因素的影响,未来可期,这些就来日再记吧! 转自个人微信公众号【Memo_Cleon】的统计学习笔记:倾向性得分匹配(PSM)。 2020.05.21 END
计算倾向得分类似于一个降维的过程,把非常多的协变量维度降为一个维度,就是倾向得分,也就是倾向得分综合包含了所有协变量的信息。两个个体的倾向得分非常接近,并不意味着这两个个体的其他属性也接近,这不好判断。不过根据PSM的原理,倾向得分接近就够了,其他属性也接近更好。
倾向评分匹配PSM,首先需要构造PS评分概率数据,然后利用PS数据按某种匹配算法从所有待选的对照样本中选择合适对象完成匹配过程。SPSSAU默认采用logistic回归模型构造PS数据,而用户则需要指定哪些数据作为协变量参与logistic回归计算PS值。协变量的选择不是随意的,具体选择依据目前有多种观点。一般来说,协变量会影响结果变量...
上述主要介绍了如何获得PSM相关的命令,本文主要介绍如何使用pscore、psmatch2以及Stata官方的PSM命令Teffects。 2 语法格式 pscore语法格式为: pscoretreatmentvarlist[weight][if exp][in range],pscore(newvar)[blockid(newvar) detail logit comsup level(#) numblo(#) ] ...
PSM解决的是选择偏差问题(即控制混杂因素),倾向得分配比就是利用倾向评分值,从对照组中为处理做中的每个个体寻找一个或多个背景特征相同或相似的个体作为对照。这样就最大程度降低了其他混杂因素的干扰。比如,想研究‘读研究生’对于收入的影响。一种简单的做法是直接对比‘读过’和‘没有读过’这两类群体的...
倾向得分匹配在真实世界临床研究用途越来越广泛,它是一种事后推动组间比较均衡化的方法。但是对样本量要求会高一点,如果样本太小,会导致处理组许多样本在控制组中找不到能匹配的样本,因此,对于样本量充足的研究,可以考虑一下PSM法来控制混杂偏倚。 接下来通过一份是实操数据集为大家详细介绍PSM法控制混杂的全套分析流...