问题描述
我有一个 Solr 数据库,其中包含大约 250,000 条记录,其中包含大约 8 个字段。 我正在尝试向索引添加一个新字段,该字段有一个可搜索的小说明。
以下是 Solr 中的字段。
以下是用于检查值是否不同以执行更新的 Java 代码。 它基本上循环遍历我的 sql 数据库中的 250,000 条记录,并对 Solr 执行差异检查。如果只有几条记录需要更新,此代码通常会在 5 分钟左右运行。
有 5500 种产品具有新的描述值,添加新字段值需要花费数小时,到目前为止只完成了 1000 种。我的印象是原子更新会添加到数据库中并在稍后编入索引。感觉就像它试图从源头索引每个新描述,也许这就是它减慢速度的原因?
if (solrsearchDoc.getFieldValue("Prod_ShortDescription") != null){
if(!solrsearchDoc.getFieldValue("Prod_ShortDescription").equals(doc.getItemValueString("Prod_ShortDescription").trim())){
UpdateSolrRecord = true;
fieldModifier.put("set",doc.getItemValueString("Prod_ShortDescription").trim());
sdoc.addField("Prod_ShortDescription",fieldModifier);
updatedField = "Prod_ShortDescription";
}
}else{
UpdateSolrRecord = true;
fieldModifier.put("set",fieldModifier);
updatedField = "Prod_ShortDescription";
}
if(UpdateSolrRecord == true){
sdoc.addField("id",doc.getItemValueString("ID"));
solrUpdateDocs.add(sdoc);
if ((x % 100) == 0) {
solrserver.add(solrUpdateDocs);
solrserver.commit();
solrUpdateDocs.clear();
}
}
我想知道是否有人可以为我指出正确的方向、解释过程或提供一些最佳实践,以确保在向 Solr 添加新值时性能不会停滞不前。有没有更好的批量更新方法,还是我遗漏了什么?
值得指出的是,我在控制台上遇到了很多这样的错误。
org.apache.solr.client.solrj.impl.HttpSolrClient$RemoteSolrException:来自服务器 http://127.0.0.1:8983/solr/prod_core 的错误:建议程序未构建 03/06/2021 10:19:44 HTTP JVM:在 org.apache.solr.client.solrj.impl.HttpSolrClient.executeMethod(HttpSolrClient.java:665) 03/06/2021 10:19:44 HTTP JVM:在 org.apache.solr.client.solrj.impl.HttpSolrClient.request(HttpSolrClient.java:265) 03/06/2021 10:19:44 HTTP JVM:在 org.apache.solr.client.solrj.impl.HttpSolrClient.request(HttpSolrClient.java:248)
非常感谢
解决方法
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)