关于何时使用spring / hibernate为批处理作业启动新的会话/事务以及何时提交/刷新会话的最佳实践?

问题描述

| 我在春季设置了一个TX建议,以围绕我的Service方法包装事务。这么说,在我的批处理类中,我调用一个服务方法来加载对象列表并将其返回给我的批处理类。然后在批处理类中,我调用一个服务方法来处理每个对象。但是,如果该服务方法尝试访问对象的延迟加载属性,则我将收到延迟加载异常,因为该对象列表是通过不同的休眠会话加载的。 因此,解决该问题的最佳方法是-批处理类仅调用服务以加载这些对象的所有ID(长值)-然后将其传递给服务方法,该方法将从然后通过ID对DB进行处理。 有这个想法吗? 我遇到的另一个问题是,如果这些对象中的每个对象彼此独立,那么我是否应该一次不持久地保留每个对象,而不是一次或批量地持久化所有对象。如果有5000条记录,则似乎应用程序在调用save / update / insert时会减慢很多速度,因为它仍在Hibernate Session中完成所有内存操作。但是,如果我改为保存/更新/插入每条记录(一次处理一个ID),然后在处理完该对象后再提交到下一个对象,则提交该记录,这似乎可以大大提高速度。另外,如果我进行批量处理,比如说每200个甚至一次全部进行5000次,如果一条记录无法插入/更新并出现错误,则任何内容都不会持久化,并且一切都会回滚。 处理此类事情的最佳实践是什么?好像真的很普通。谢谢     

解决方法

        首先,Spring / Hibernate并不是真正用于批处理。相反,请检查Talend或Pentaho(如果您是开源的),或任何种类繁多(大量!)的商业工具。这些工具中的任何一个都可以用来自动生成可以完全满足您需要的Java代码块(包括插入优化,优雅的错误处理等)。 好的,假设您确实要让Spring / Hibernate进行批处理。您有几个不同的问题-首先,Hibernate会话生命周期意味着加载的对象希望与实时会话相关联。您可以使用会话flush()强制将更改传播到数据库。会话close()将清除所有内容。只能很困难地将已经加载的对象重新附加到新的会话(通常,重新加载对象比较容易)。如果不关闭()/ flush()会话,最终(可能)会耗尽内存。您可以通过添加一个Hibernate 2级缓存来解决此问题,但这只会使事情变得更加复杂并使它变慢。 没有真正的理由不只是在独立的Hibernate会话中进行每次插入(打开,执行工作,关闭)。它不会像专用工具那样快,但是它很简单,可以很好地工作,并且或多或少都与您得到的一样好。     ,        关于批处理要求,请使用Spring批处理链接 这提供了所需的所有必要的配料设备。 关于对象加载问题,   所以解决这个问题的方法可能不是   最好的是-批次类   只是调用服务来加载所有   这些对象的ID(长值)-   然后我们将此ID传递给服务   加载该对象的方法   从数据库通过ID,然后执行   处理。 似乎是正确的。