固定资产在泊松估计中如何处理已降级因变量的负值? 建模策略 GLM

问题描述

我需要执行具有固定效果(比如说单位FE)和几个回归变量(RHS变量)的glm(泊松)估计。我有一个不平衡的面板数据集,其中大多数(〜90%)观测值的某些回归变量(但不是全部回归变量)缺少值(NA)。

fixest::feglm()可以处理此问题并返回我拟合的模型。 但是,为此,它(还有fixest::demean)在构造固定效应均值之前 会删除至少缺少一个回归变量的观测值。

就我而言,恐怕这意味着未在数据中使用大量可用信息。 因此,我想手动对变量进行淡化,以便能够在每个固定效果维的均值中包含尽可能多的信息,然后对淡化后的数据运行feglm。但是,这意味着获得负的因变量值,这与Poisson不兼容。如果我使用“ poisson”家族运行feglm并手动删除了数据,则(一致)得到:““ poisson”家族不允许因变量的负值。”。使用fixest::demean函数删除的数据会返回相同的错误。

问题:

feglm如何处理已贬值的因变量的负值?是否有一种方法(如某些数据转换)可以在公式中的固定效果上重现fepois,而对已淡化的数据和没有固定效果的公式重现fepois呢?

要使用fixest::demean文档中的示例(具有双向固定效果):

data(trade)

base = trade
base$ln_dist = log(base$dist_km)
base$ln_euros = log(base$Euros)

# We center the two variables ln_dist and ln_euros
#  on the factors Origin and Destination
X_demean = demean(X = base[,c("ln_dist","ln_euros")],fe = base[,c("Origin","Destination")])
base[,c("ln_dist_dm","ln_euros_dm")] = X_demean

我想复制

est_fe = fepois(ln_euros ~ ln_dist | Origin + Destination,base)

使用

est = fepois(ln_euros_dm ~ ln_dist_dm,base)

解决方法

我认为主要有两个问题。

建模策略

通常,重要的是要能够正式描述估计的模型。 在这种情况下,不可能用一个方程式来写下模型,在方程式中,仅在非缺失观测值上使用所有数据和其他变量来估计固定效果。如果模型不清楚,那么...可能不是一个好的模型。

另一方面,如果您的模型定义良好,则删除随机观测值不应更改系数的期望,仅改变其方差。同样,如果您的模型指定正确,则不必担心太多。

通过暗示缺失值的观测值与估计固定效果系数有关(或者换句话说,它们用于表示某些变量),您暗示这些观测值不是是随机分布的。现在您应该担心。

仅使用这些观察值来对变量进行贬值,就不会因为选择非缺失而消除估计系数的偏差。这是一个更深层次的问题,不能通过技术技巧来解决,而只能通过对数据的深刻理解来消除。

GLM

对GLM有误解。 GLM是使用OLS估计最大似然模型的超级聪明的技巧(有一个很好的描述here)。它是在常规优化技术在计算时间上非常昂贵的时候开发和使用的,它是一种使用成熟的快速OLS技术执行等效估计的方法。

GLM是一个迭代过程,其中在每个步骤执行典型的OLS估计,每次迭代中唯一的变化涉及与每个观察值相关的权重。因此,由于它是常规的OLS流程,因此可以利用执行具有多个固定效果的快速OLS估计的技术(如 fixest 包中的方法)。

因此,实际上,您可以做您想做的...但是只能在GLM算法的OLS步骤中进行。绝对不要在运行GLM之前对数据进行贬损,因为这毫无意义(FWL定理在这里绝对不成立)。

相关问答

错误1:Request method ‘DELETE‘ not supported 错误还原:...
错误1:启动docker镜像时报错:Error response from daemon:...
错误1:private field ‘xxx‘ is never assigned 按Alt...
报错如下,通过源不能下载,最后警告pip需升级版本 Requirem...