使用Pegasus进行迁移学习以进行文本摘要生成垃圾字符

问题描述

我一直在尝试使用Pegasus library并按照上述步骤生成摘要-

  1. .tfrecord中创建的输入数据pegasus\data\testdata
  2. 创建了一个函数以返回名为transformer_params的{​​{1}}(假设)
  3. 运行test_transformers
  4. python3 pegasus/bin/train.py --params=test_transformer --param_overrides=vocab_filename=ckpt/pegasus_ckpt/c4.unigram.newline.10pct.96000.model,batch_size=1,beam_size=5,beam_alpha=0.6 --model_dir=ckpt/pegasus_ckpt/xsum/model.ckpt-30000

但是,当我生成文本时,我在输出中遇到了这个问题-

Outputs Having Junk

其实现方式或我在步骤3和4中运行python代码的方式是否存在问题?

预先感谢!

解决方法

这里是link to the closed issue

突出显示此问题的原因是:-

1. --model_dir is typically a directory instead of a particular checkpoint. 
   -> Try changing model_dir to actual model directory instead of checkpoint
2. It seems there are only 100 training steps. 
   -> Try changing "train_steps": 100