从拥抱面特征提取管道中获取句子嵌入

问题描述

我如何从huggingface的特征提取管道中为整个句子嵌入?

我了解如何获取每个标记功能(如下),但如何获取整个句子的整体功能

feature_extraction = pipeline('feature-extraction',model="distilroberta-base",tokenizer="distilroberta-base")
features = feature_extraction("i am sentence")

解决方法

如果每个标记都有嵌入,则可以通过合并(汇总)它们来创建整体句子嵌入。请注意,如果您具有D维令牌嵌入,则应通过以下方法之一获得D维句子嵌入:

  1. 计算所有令牌嵌入的均值。

  2. 计算所有令牌嵌入中每个D维的最大值。

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...