问题描述
我希望使用 Allen NLP Interpret 进行集成可视化和显着性映射。在自定义转换器模型上,您能告诉我该怎么做吗?
解决方法
这可以通过在您的自定义模型周围使用 AllenNLP 包装器来完成。解释模块需要一个 Predictor 对象,因此您可以编写自己的或使用现有的。
以下是分类模型的示例:
from allennlp.data.vocabulary import Vocabulary
from allennlp.predictors.text_classifier import TextClassifierPredictor
from allennlp.data.dataset_readers import TextClassificationJsonReader
import torch
class ModelWrapper(Model):
def __init__(self,vocab,your_model):
super().__init__(vocab)
self.your_model = your_model
self.logits_to_probs = torch.nn.Softmax()
self.loss = torch.nn.CrossEntropyLoss()
def forward(self,tokens,label=None):
if label is not None:
outputs = self.your_model(tokens,label=label)
else:
outputs = self.your_model(tokens)
probs = self.logits_to_probs(outputs["logits"])
if label is not None:
loss = self.loss(outputs["logits"],label)
outputs["loss"] = loss
outputs["probs"] = probs
return outputs
您的自定义转换器模型可能没有可识别的 TextFieldEmbedder
。这是模型的初始嵌入层,针对显着性解释器计算梯度。这些可以通过覆盖预测器中的以下方法来指定。
class PredictorWrapper(TextClassifierPredictor):
def get_interpretable_layer(self):
return self._model.model.bert.embeddings.word_embeddings # This is the initial layer for huggingface's `bert-base-uncased`; change according to your custom model.
def get_interpretable_text_field_embedder(self):
return self._model.model.bert.embeddings.word_embeddings
predictor = PredictorWrapper(model=ModelWrapper(vocab,your_model),dataset_reader=TextClassificationJsonReader())
现在你有了一个 AllenNLP 预测器,它可以与解释模块一起使用,如下所示:
from allennlp.interpret.saliency_interpreters import SimpleGradient
interpreter = SimpleGradient(predictor)
interpreter.saliency_interpret_from_json({"sentence": "This is a good movie."})
这应该为您提供关于每个输入标记的梯度。