在许多研究中,常会使用到配对的字眼,感觉这配对似乎有点难度,但实际上以Finance的视角来考量,配对很难,但是如果采用数据库的想法,配对根本不是个事,使用SQL就没有问题了
先前介绍了日期配对的方法,接下来介绍,样本特征的配对
在上述句子中,研究者就使用了 跟原本公司规模相似的10%的公司作为配对公司进行分析,而过去研究会使用 BM, size, roa等特征相似的公司作为配对样本,这就跟我国结婚讲究门当户对的逻辑是一样的,因此SAS之家开发了CH_match这样的宏语法,进行对样本公司进行门当户对的配对
使用数据
链接:https://pan.baidu.com/s/1Uy_DWKGEcWjpTjM1vnNPkQ 密码:m16s
宏语法
链接:https://pan.baidu.com/s/1wyDOtpb8OFnBte7YFKqTkg 密码:5p65
宏语法的使用如下
%ch_match(sample,full,firm,time,industry,matvar,ratio,seed);
其中 sample为使用的文件(需要搜寻配对样本的文件)
full为用来找配对公司的样本(可包含样本公司)
firm 为公司代号
time为时间变量
industry为行业别变量
matvar为 要配对的特征变量串(可多个)
ratio为 配对样本与事件样本之间的特征值差异比例
0.1 表示范围为 0.9~1.1之间
seed为种子值
当 配对样本超过两个时,会有几种处理方法,其中之一为随机抽选一家控制公司
以下为使用的数据
在full以及sample中(该两个文件可以另外命名)
都需要包含 公司代号 年份 行业别 以及相同的变量(以便进行配对)
而在使用上只要输入
%ch_match(sample,full,stkcd,year,ind,ta bm roe,0.1,1);
以上为使用 ta bm 以及roe进行配对,采用0.1的门限(0.9~1.1)种子值为1
宏语法运行完毕后,就会生成
imatch,amatch,min_match以及random_match
其中imatch为初始配对样本
亦即在该条件下能够配对的总样本
因再这样的情况下,研究者可以决定是否要只使用一家公司
则可以选择
随机由配对样本中抽取一家公司(random_match)
计算所有变量的差异值绝对值的加总值,使用最小值的那家公司(min_match)
直接使用配对样本公司的这些变量的均值 作为配对特征(但如果要进行其他检定 则没有意义) (Amatch)
如此一来就能快速完成 特征值的配对了
当然,现在还有一些研究会推崇使用PSM的方法,基本上都是可行的做法,提供各位朋友做参考
-----------------------------------------------------
微信公众号SAS之家致力于介绍SAS编成的各项技巧以及数据库的建构,定期推送以SAS完成实证论文的作法,定期更新Fama and French (2015) 的定价因子以及使用过去12,24,36个月的日,周,月报酬率所估计出来的系数值,特质风险以及R方,并在能力范围内提供SAS使用上的问题解决方案,本公众号由吉林大学林煜恩老师及其团队经营。
敬请关注SAS之家
敬请赏赞,支持公众号经营
领取专属 10元无门槛券
私享最新 技术干货