我不能让熊猫的功能为我工作.这是一个简单的例子.我使用以下命令将kaggle数据集读入数据框:
import pandas as pd
train_data=pd.read_csv('kaggle_train.csv',header=None)
然后我使用head命令询问前五个数据行:
train_data.head()
我没有获得前五行数据,而是得到了这个输出:
<class 'pandas.core.frame.DataFrame'>
Int64Index: 5 entries, 0 to 4
Data columns:
X0 5 non-null values
X1 5 non-null values
X2 5 non-null values
X3 5 non-null values
X4 5 non-null values
X5 5 non-null values
X6 5 non-null values
X7 5 non-null values
X8 5 non-null values
X9 5 non-null values
X10 5 non-null values
X11 5 non-null values
X12 5 non-null values
X13 5 non-null values
X14 5 non-null values
X15 5 non-null values
X16 5 non-null values
X17 5 non-null values
X18 5 non-null values
X19 5 non-null values
X20 5 non-null values
X21 5 non-null values
X22 5 non-null values
X23 5 non-null values
X24 5 non-null values
X25 5 non-null values
X26 5 non-null values
X27 5 non-null values
X28 5 non-null values
X29 5 non-null values
X30 5 non-null values
X31 5 non-null values
X32 5 non-null values
X33 5 non-null values
X34 5 non-null values
X35 5 non-null values
X36 5 non-null values
X37 5 non-null values
X38 5 non-null values
X39 5 non-null values
X40 5 non-null values
dtypes: float64(40), int64(1)
任何人都可以解释为什么会这样吗?
我在运行Windows Vista Home Premium Service Pack 2的HP Pavilion笔记本电脑上的IPython窗口版本0.13.1-1中运行Python 2.7.3
解决方法:
默认情况下,如果pandas有太多列以可读方式显示,则会显示输出的摘要形式.您可以通过执行print train_data.head().to_string()强制它显示实际数据,但输出可能很难读取,因为您有很多列.