问题描述
也许是个疯狂的问题:但我想下载 gpt-2 模型框架,但我想随机初始化权重。所以好像模型仍然需要在 reddit 内容(包括 json、vocab、Meta 和索引文件等)上进行微调。这可能吗?
亲切的问候!
解决方法
是的,可以随机初始化并从头开始训练。例如对于 T5,你可以这样做:
from transformers import GPT2Model,GPT2Config
config = GPT2Config.from_pretrained() # config as in the paper
model = GPT2Model(config)