问题描述
我是使用 MultiSURF 算法进行特征选择的新手。
我正在使用 skrebate 的 MultiSurf。
我有大约 6500 个特征数据集。
代码花了大约 3 天时间来创建一个距离数组。过去 5 天,它一直停留在“Feature Scoring undr way...”上。
我做错了什么?
代码如下:
fs = MultiSURF(n_features_to_select=100,verbose=True)
fs.fit(X,y)
print("Printing for FS")
print(fs.feature_importances_)
print(fs.top_features_)
print("Done Printing for FS")
dfDashboard = pd.DataFrame()
for feature_name,feature_score in zip(df.drop(responseCol,axis=1).columns,fs.feature_importances_):
print(feature_name,'\t',feature_score)
new_record = pd.DataFrame([[feature_name,feature_score]],columns=['FeatureName','score'])
dfDashboard = pd.concat([dfDashboard,new_record])
有人可以帮忙理解吗? MultiSurf 是否不适用于具有 1000 个特征的数据集?
谢谢
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)