如何在分位数回归中找出不同分位数的系数是否显着不同？ SPSS 或 Python

问题描述

我正在检查某个行业的收入增长率在收入分配的不同部分是否存在显着差异，以查看收入差距是否显着拉长或缩小。

QUANTREG 模型

我在 SPSS 中执行了分位数回归（我是编码新手，只有 Python 的基本知识，所以我需要您的帮助）。因变量是指数收入，自变量是时间（本数据集中的季度）、人口群体、行业细分。我还添加了每个虚拟对象与时间变量的交互项。

所以（至少在我看来），这个模型允许在三个层面上比较收入的变化：

属于某个人口群体或细分市场如何影响收入（例如，与数据录入工作相比：数据分析增加 100 欧元，数据科学增加 200 欧元）
每个不同类别/虚拟对象的影响如何随时间变化（例如，与数据录入工作相比，成为数据科学家的积极影响增加了 10%，现在增加了 220 欧元）
这些变化的影响在收入分配的不同部分之间有何不同（例如，时间*data_scientist 的系数在 90%Q 中比在 10%Q 中大得多，表明收入较高的数据科学家已经看到与收入较低的数据科学家相比，随着时间的推移收入增加幅度更大）

问题

所以我在 SPSS 上得到了这个分位数回归的输出，这是一个包含所有系数及其显着性和置信区间的巨大表格。

现在我想找出90%Q和10%Q之间的差异在统计上是否显着，以便说明这个行业的收入差距是显着增加还是减少了。我想在 Python 而不是 SPSS 上执行此操作，我搜索了如何将数据分成分位数，以及如何执行分位数回归。但是，应该如何测试 90%Q 和 10%Q 之间差异的显着性？

解决方法

我找到了一种方法来测试回归系数是否有显着差异，50% 规则使用标准化 Beta 权重及其 95% 置信区间（可以通过偏差校正引导程序估计；对于分位数回归，它们通常已在输出中提供）。该规则基本上指出，如果两个样本均值的 95% 置信区间的重叠小于 50%，则存在显着差异 (p=0.05)。在小于 14% 重叠的情况下，显着性水平为 p=0.01。

这是我发现这种方法的 Youtube 视频：

https://www.youtube.com/watch?v=qKnpiGwNDMk

以及 Youtube 视频所引用的论文：

卡明 G. (2009)。肉眼推断：读取置信区间的重叠。 医学统计学，28(2)，205-220。