如何在python中为事件研究创建虚拟变量

问题描述

我有 49 年,从 1970 年到 2018 年,每一年都有一个极性分数(情绪分析)。通过简单回归 (OLS),我想衡量特定年份(1986 年)发生的事件对极性分数的影响。

数据示例:

      Polarity
1970  0.051859
1971  0.053490
1972  0.074705
1973  0.069377
1974  0.088141
1975  0.078384
1976  0.067911
1977  0.068354
1978  0.067758
1979  0.075665
1980  0.065912
1981  0.051863
1982  0.059517
1983  0.081379
1984  0.052928
1985  0.110824
1986  0.054214
1987  0.074198
1988  0.059640
1989  0.038797
1990  0.077892

现在我想知道如何添加一个代表 1986 年事件的虚拟变量,以便我可以衡量对因变量的影响:极性。

解决方法

如果您的数据框 (df) 中有一个名为“year”的列,它记录每个事件发生的年份,您可以通过以下方式使用 Pandas:

pd.get_dummies(df,columns=['year'],drop_first=True)

“Dropfirst”确保您省略了回归通常需要的一个虚拟对象。