RRelief 特征选择,使用来自 skrebate 的 multisurf

问题描述

我是使用 MultiSURF 算法进行特征选择的新手。

我正在使用 skrebate 的 MultiSurf。

我有大约 6500 个特征数据集。

代码花了大约 3 天时间来创建一个距离数组。过去 5 天,它一直停留在“Feature Scoring undr way...”上。

我做错了什么?

代码如下:

    
    fs = MultiSURF(n_features_to_select=100,verbose=True)

    fs.fit(X,y)

    print("Printing for FS")
    print(fs.feature_importances_)
    print(fs.top_features_)
    print("Done Printing for FS")

    dfDashboard = pd.DataFrame()

    for feature_name,feature_score in zip(df.drop(responseCol,axis=1).columns,fs.feature_importances_):
        print(feature_name,'\t',feature_score)

        new_record = pd.DataFrame([[feature_name,feature_score]],columns=['FeatureName','score'])
        dfDashboard = pd.concat([dfDashboard,new_record])

有人可以帮忙理解吗? MultiSurf 是否不适用于具有 1000 个特征的数据集?

谢谢

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)