问题描述
我正在尝试创建一个相对较快的模型,该模型需要获取一组文档的单词嵌入以用于分类。现在,在Spark中,似乎最慢的部分是从spark-nlp包中加载到BertEmbeddings模型中。我知道这是因为模型很大,但是值得尝试在Spark运行时环境(例如Azure)中腌制或缓存嵌入模型吗?还是每次运行都需要一段时间才能完全加载它?
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)