是否有“未经训练的”gpt 模型文件夹?

问题描述

也许是个疯狂的问题:但我想下载 gpt-2 模型框架,但我想随机初始化权重。所以好像模型仍然需要在 reddit 内容包括 json、vocab、Meta 和索引文件等)上进行微调。这可能吗?

亲切的问候!

解决方法

是的,可以随机初始化并从头开始训练。例如对于 T5,你可以这样做:

from transformers import GPT2Model,GPT2Config

config = GPT2Config.from_pretrained() # config as in the paper
model = GPT2Model(config)