问题描述
当前日期范围:
d = {'CCYPair': ['EURUSD','USDJPY'],'Spot': [1.2,109]}
df = pd.DataFrame(data=d)
我希望将 CCYPair 列拆分为 CCY1 和 CCY2。这可以在 Excel 中使用 Text-to-columns 或通过 Left 和 Right 函数轻松实现。然而,即使搜索了一段时间,我还是发现在 Pandas 数据框中实现相同的结果非常棘手。
我只能找到 pandas.read_fwf 但那是为了从文件中读取。我已经有了一个数据框,并且希望根据固定宽度拆分其中一列。
我确定我在这里遗漏了一些基本的东西 - 就是不知道是什么。
我尝试过 df['CCY1'] = df['CCYPair'][0:3]
但这适用于列上的 [0:3] 而不是列中的每个条目。所以我最终得到了前三个 CCYPair 值,然后是 NaN。
预期结果:
d = {'CCY1': ['EUR','USD'],'CCY2': ['USD','JPY'],109]}
df = pd.DataFrame(data=d)
解决方法
你可以试试extract
:
df[['CCY1','CCY2']] = df.CCYPair.str.extract('(.{3})(.*)')
输出:
CCYPair Spot CCY1 CCY2
0 EURUSD 1.2 EUR USD
1 USDJPY 109.0 USD JPY
,
您也可以使用 str.slice 方法:
df['CCY1'] = df['CCYPair'].str.slice(stop=3)
df['CCY2'] = df['CCYPair'].str.slice(start=3)
输出:
CCYPair Spot CCY1 CCY2
0 EURUSD 1.2 EUR USD
1 USDJPY 109.0 USD JPY