余弦与DataFrame的相似性

问题描述

from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity

def get_tf_idf_query_similarity(documents,query):
    allDocs = []
    for document in documents:
        allDocs.append(nlp.clean_tf_idf_text(document))
    docTFIDF = TfidfVectorizer().fit_transform(allDocs)
    queryTFIDF = TfidfVectorizer().fit(allDocs)
    queryTFIDF = queryTFIDF.transform([query])

    cosinesimilarities = cosine_similarity(queryTFIDF,docTFIDF).flatten()
    return cosinesimilarities

我需要像这样将这些相似性转换为DataFrame：

allDocs代表不同的文档，而query是针对allDocs中的每个文档进行评估的同一新文档。如何执行此操作？预先感谢

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

cosine-similarity dataframe python-3.x