问题描述
我想要几乎与 pandas
的回答 here 相同 - 但想在 vaex
中运行它。
由于 vaex
执行延迟复制,对我来说,将 str.split
的(我的两列)列保存到 vaex-df 中是可以的。但是没有什么比 expand=True
更合适。
解决方法
要在 vaex 4.0.0 中执行此操作,您无法直接使用切片检索令牌,您必须在 apply
方法中使用切片。
以下是适用于 vaex 的示例:
import pandas as pd
import vaex
df = pd.DataFrame({'ticker' : ['spx 5/25/2001 p500','spx 5/25/2001 p600','spx 5/25/2001 p700']})
df_vaex = vaex.from_pandas(df)
df_vaex["ticker"].str.split(" ").apply(lambda x: x[-1])
它给出了预期的输出:
Expression = lambda_function(str_split(ticker,' '))
Length: 3 dtype: string (expression)
------------------------------------
0 p500
1 p600
2 p700