问题描述
我有两张桌子。
表 A 有 105 行:
bbgid dt weekly_price_per_stock weekly_pct_change
0 BBG000J9HHN8 2018-12-31 13562.328 0.000000
1 BBG000J9HHN8 2019-01-07 34717.536 1.559851
2 BBG000J9HHN8 2019-01-14 28300.218 -0.184844
3 BBG000J9HHN8 2019-01-21 35370.134 0.249818
4 BBG000J9HHN8 2019-01-28 36104.512 0.020763
... ... ... ... ...
100 BBG000J9HHN8 2020-11-30 62065.827 0.278765
101 BBG000J9HHN8 2020-12-07 62145.445 0.001283
102 BBG000J9HHN8 2020-12-14 63516.146 0.022056
103 BBG000J9HHN8 2020-12-21 51283.187 -0.192596
104 BBG000J9HHN8 2020-12-28 51306.951 0.000463
表 B 有 257970 行:
bbgid dt weekly_price_per_stock weekly_pct_change
0 BBG000B9WJ55 2018-12-31 34.612737 0.000000
1 BBG000B9WJ55 2019-01-07 70.618471 1.040245
2 BBG000B9WJ55 2019-01-14 89.123337 0.262040
3 BBG000B9WJ55 2019-01-21 90.377643 0.014074
4 BBG000B9WJ55 2019-01-28 90.527678 0.001660
... ... ... ... ...
257965 BBG00YFR2NJ6 2020-12-21 30.825000 -0.251275
257966 BBG00YFR2NJ6 2020-12-28 40.960000 0.328792
257967 BBG00YM46B38 2020-12-14 0.155900 -0.996194
257968 BBG00YM46B38 2020-12-21 0.372860 1.391661
257969 BBG00YM46B38 2020-12-28 0.535650 0.436598
在表 A 中只有一组股票 (CCPM),但在表 B 中我有很多不同的股票组。我想对表 B pct_change
与表 A (CCPM) pct_change
进行线性回归,这样我就可以知道表 B 中的股票在{{{ {1}} 列。问题是我在表 A 中只有 105 行,当我按 dt
对表 B 进行分组时,我总是得到更多的行,所以我有一个错误,说 X 和 y 必须是相同的大小。
这两个表之前都按周分组,并且它们的 bbgid
是每周计算的。我应该比较表 B 中 pct_change
和表 A 中的变化,基于日期和一次一组来自表 B 与 CCPM 股票的 pct_change
。
我想从每个回归中提取斜率并将它们存储在同一个表内的一列中,并将其关联到相应的组。
我已经尝试了 this 个帖子和 this 个帖子中的解决方案,但没有成功。
是否有任何解决方法可以做到这一点,或者我做错了什么?请帮我解决这个问题。
非常感谢您。
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)