在分类文本问题上实施 BERT 过程中出现的错误

问题描述

最近 Matlab 在他们的 git 存储库中启动了 BERT。有一个使用 BERT 对文本数据进行分类的示例。我正在尝试按原样运行此代码。

在这里,我对数据无法划分为测试数据感到震惊。

我正在尝试的代码块如下:

%% 
mdl = bert;
%% 
tokenizer = mdl.Tokenizer
%% 
filename = "factoryReports.csv";
data = readtable(filename,"TextType","string");
head(data)
%% 
data.Category = categorical(data.Category);
classes = categories(data.Category);
numClasses = numel(classes)
%% 
data.Tokens = encode(tokenizer,data.Description);
%% 
cvp = cvpartition(data.Category,"Holdout",0.2);
dataTrain = data(training(cvp),:);
dataValidation = data(test(cvp),:);

错误显示在执行的最后一行,错误如下:

Unable to use a value of type cvpartition as an index.
Error in Untitled (line 18)
dataValidation = data(test(cvp),:);

这可能是什么原因以及如何解决此问题?我正在寻求您的建议。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)