首先使用logit或probit回归等统计模型,根据一组预先选定的协变量来估计每个个体接受处理的概率,这个概率被称为倾向得分(Propensity Score)。然后,根据倾向得分将实验组和对照组的个体进行匹配,以确保两组在关键变量上的分布尽可能相似。PSM可以结合双重差分模型(DID)使用,形成PSM-DID模型,以处理更为复杂的因果推...
(2)卡钳匹配/半径匹配/卡尺匹配(caliper matching/radius matching):卡钳值是指当两组研究对象根据PS值进行匹配时所允许的误差范围,卡钳匹配是在最近邻匹配法的基础上应用的匹配法,设定倾向得分差距的绝对值ε作为卡尺范围/半径范围,将得分值差异在卡尺范围内的不同组个体进行配对。该方法解决了最近邻匹配法在配对组...
倾向性得分,将多个维度的匹配任务降维成了仅依据得分进行匹配的方法。在一个维度(倾向得分)中查找相似样本比在多个维度(混杂因素)中查找要容易得多。 匹配算法 匹配算法种类较多,这里也无法一一介绍,可以结合自身的业务场景,选择匹配规则(一对一、一对多)、标准衡量(欧式距离)以及匹配算法(KNN、K-means等)。 这里主...
倾向性得分本身并不能控制混杂,而是通过PS匹配、加权、分层或进入回归模型直接调整混杂等方式,不同程度地提高对比组间的均衡性,从而削弱或平衡协变量对效应估计的影响,达到“类随机化”的效果,又称为事后随机化。简单理解,就是从大量的样本数据中将具有共同特征的干预组和对照组样本挑选出来,然后对这些符合要求的样本...
倾向得分匹配是指,找一个其他各方面与该个体尽量相似意味着要考虑两个个体的很多方面,让尽可能多的方面尽量相似,而高维匹配并不容易,因为维度越高找一个各方面相似的两个个体越难。为了解决这个问题,RosenbaumandRubin(1983)提出了倾向得分的概念。个体的倾向得分是指在个体情况一定的前提下,其进入处理组的概率。倾向...
选择【计量经济研究】--【倾向得分匹配】。【研究变量】:放入主要研究变量。本例中为“是否读研”【特征项】:放入其他可能影响结果的变量。本例中为“父亲学历”、“母亲学历”、“父亲是否从事教育”、“母亲是否从事教育”。依次将变量放入,点击开始分析。SPSSAU默认使用最邻近匹配法,进行匹配。抽选方法可以选择不...
在SPSSAU“计量经济研究”栏目下选择【倾向得分匹配】,首先将“是否培训”拖拽至【研究变量】框内,它将作为logistic回归的二结局因变量,特别注意水平编码,要求是1表示处理组,0表示对照组。 “初始成绩”、“工作经验”、“职位类别”拖拽至【特征项】框。
选择【计量经济研究】--【倾向得分匹配】。 【研究变量】:放入主要研究变量。本例中为“是否读研” 【特征项】:放入其他可能影响结果的变量。本例中为“父亲学历”、“母亲学历”、“父亲是否从事教育”、“母亲是否从事教育”。 依次将变量放入,点击开始分析。
倾向得分匹配算法步骤如下:(1)计算倾向得分Pscore值 构建一个是否接受培训的二分类变量作为因变量,以干扰因素作为自变量X进行二元logit回归模型构建,然后根据logit模型计算倾向得分Pscore值。Pscore值代表了干扰因素的整体水平情况,Pscore值越接近,说明两个研究对象(员工)的特征(初始工资等)越接近,第二步进行...