如何将Scikit学习的load_digits转换为Pandas数据集?

问题描述

from sklearn.datasets import load_digits
digits=load_digits()
import pandas as pd
df= pd.DataFrame(data= digits.data,columns=digits.feature_names)
df['images']= digits.images

AssertionError:新值的形状必须与管理者形状兼容

这行代码df['images']= digits.images

遇到了麻烦

解决方法

如果查看digits.images形状,您会发现其尺寸为(1797,8,8),这意味着您将无法直接将其适合(1797,64)数据框。如果只需要具有功能和标签数据框,则只需对as_frame=True调用使用load_digits参数:

from sklearn.datasets import load_digits
import pandas as pd

digits=load_digits(as_frame=True)

X = digits.data
y = digits.target