固定资产在泊松估计中如何处理已降级因变量的负值？建模策略 GLM

问题描述

我需要执行具有固定效果（比如说单位FE）和几个回归变量（RHS变量）的glm（泊松）估计。我有一个不平衡的面板数据集，其中大多数（〜90％）观测值的某些回归变量（但不是全部回归变量）缺少值（NA）。

fixest::feglm()可以处理此问题并返回我拟合的模型。但是，为此，它（还有fixest::demean）在构造固定效应均值之前会删除至少缺少一个回归变量的观测值。

就我而言，恐怕这意味着未在数据中使用大量可用信息。因此，我想手动对变量进行淡化，以便能够在每个固定效果维的均值中包含尽可能多的信息，然后对淡化后的数据运行feglm。但是，这意味着获得负的因变量值，这与Poisson不兼容。如果我使用“ poisson”家族运行feglm并手动删除了数据，则（一致）得到：““ poisson”家族不允许因变量的负值。”。使用fixest::demean函数删除的数据会返回相同的错误。

问题：

feglm如何处理已贬值的因变量的负值？是否有一种方法（如某些数据转换）可以在公式中的固定效果上重现fepois，而对已淡化的数据和没有固定效果的公式重现fepois呢？

要使用fixest::demean文档中的示例（具有双向固定效果）：

data(trade)

base = trade
base$ln_dist = log(base$dist_km)
base$ln_euros = log(base$Euros)

# We center the two variables ln_dist and ln_euros
#  on the factors Origin and Destination
X_demean = demean(X = base[,c("ln_dist","ln_euros")],fe = base[,c("Origin","Destination")])
base[,c("ln_dist_dm","ln_euros_dm")] = X_demean

我想复制

est_fe = fepois(ln_euros ~ ln_dist | Origin + Destination,base)

使用

est = fepois(ln_euros_dm ~ ln_dist_dm,base)

解决方法

我认为主要有两个问题。

建模策略

通常，重要的是要能够正式描述估计的模型。在这种情况下，不可能用一个方程式来写下模型，在方程式中，仅在非缺失观测值上使用所有数据和其他变量来估计固定效果。如果模型不清楚，那么...可能不是一个好的模型。

另一方面，如果您的模型定义良好，则删除随机观测值不应不更改系数的期望，仅改变其方差。同样，如果您的模型指定正确，则不必担心太多。

通过暗示缺失值的观测值与估计固定效果系数有关（或者换句话说，它们用于表示某些变量），您暗示这些观测值不是是随机分布的。现在您应该担心。

仅使用这些观察值来对变量进行贬值，就不会因为选择非缺失而消除估计系数的偏差。这是一个更深层次的问题，不能通过技术技巧来解决，而只能通过对数据的深刻理解来消除。

GLM

对GLM有误解。 GLM是使用OLS估计最大似然模型的超级聪明的技巧（有一个很好的描述here）。它是在常规优化技术在计算时间上非常昂贵的时候开发和使用的，它是一种使用成熟的快速OLS技术执行等效估计的方法。

GLM是一个迭代过程，其中在每个步骤执行典型的OLS估计，每次迭代中唯一的变化涉及与每个观察值相关的权重。因此，由于它是常规的OLS流程，因此可以利用执行具有多个固定效果的快速OLS估计的技术（如 fixest 包中的方法）。

因此，实际上，您可以做您想做的...但是只能在GLM算法的OLS步骤中进行。绝对不要在运行GLM之前对数据进行贬损，因为这毫无意义（FWL定理在这里绝对不成立）。

glm manual-testing panel-data poisson r

固定资产在泊松估计中如何处理已降级因变量的负值？ 建模策略 GLM

问题描述

解决方法

建模策略

GLM

相关问答

固定资产在泊松估计中如何处理已降级因变量的负值？建模策略 GLM