请考虑以下df:
df = pd.DataFrame({'a':[1,2], 'b':[1,2], 'c':[1,2], 'd':[1,2], 'e':[1,2], 'f':[1,2], 'g':[1,2], 'h':[1,2]})
a b c d e f g h
0 1 1 1 1 1 1 1 1
1 2 2 2 2 2 2 2 2
如何选择第一,第四和第五至第七列?
我试过的
df.iloc[:, [0, 3, np.arange(5,8)]]
ValueError: setting an array element with a sequence.
解决方法:
你可以这样做:
df.iloc[:, [0, 3] + list(range(5,8))]
[0,3] list(range(5,8))连接2个列表,将您的显式列表与从所需范围派生的列表组合在一起.
或者,您可以使用numpy.r
为您构建索引数组:
import numpy as np
df.iloc[:, np.r_[0,3,5:8]]
np.r_[0,3,5:8] # array([0, 3, 5, 6, 7])
例如,如果您有多个范围,这将很有用.