链接预测SVM交叉验证,F分数低的问题

问题描述

我正在尝试预测图中的新边 我将其转换为带有'source''destination''link'列的dataFrame,'link'是二进制变量,如果节点对之间存在边,则link = 1,否则为0

为了发挥我使用Node2Vec的功能(如果有更好的解决方法,请告诉我),我放下了一些可移动的边缘:

# drop removable edges
df_partial = df_.drop(index= df_ghost.index.values)

# build graph
G_data = nx.from_pandas_edgelist(df_partial,"node_1","node_2",create_using=nx.Graph())

# Generate walks
node2vec = Node2Vec(G_data,dimensions=77,walk_length=17,num_walks=50)

# train node2vec model
n2w_model = node2vec.fit(window=7,min_count=1)

x = [(n2w_model[str(i)]+n2w_model[str(j)]) for i,j in zip(data['node_1'],data['node_2'])]

使用SVM和交叉验证来获取Accuracy,F1,Precision,Recall,AucRoc,Confusion Matrix metricx:

clf_svm = svm.SVC(kernel='rbf',C=1)
#scores_svm = cross_val_score(clf_svm,np.array(x),data['link'],cv=5)
predicted = cross_val_predict(clf_svm,cv=5,n_jobs=2)

结果

Accuracy  0.8344660194174758
F1  0.005830903790087464
F1 micro  0.8344660194174758
FA macro  0.4577738050854064
Precision  0.16666666666666666
Avg precision score  0.1636013559582457
Confusion Matrix : [[1718    5]
 [ 336    1]]
Recall  0.002967359050445104
Roc Auc score  0.5000327218931855

在这里做错了什么?是特征提取的问题吗

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)