写入Aurora postgres主实例时,只读副本滞后会成比例增加

问题描述

我们目前使用Scala spark应用程序,该应用程序将复制命令启动到aurora Postgres写入实例。

管道每天写入约5Tb的数据,并以并行方式写入不同的分区。几乎有500个活动会话都是复制命令。

写入过程大约需要6个小时,这并不是说每个问题,但是在此期间,写入实例变得非常缓慢,这使得平台(指向写入实例)在此期间给出超时错误

现在,我们将平台指向只读副本,但是结果不是很好。在这些并行写入期间,只读副本滞后很多,以致实例不断重启。滞后指标浮动(写持续时间为100k ms,而通常保持在100ms以下)。

我尝试采用一种混合方法来按顺序扩展写操作,这样一次最多可以运行100个复制命令,但是即使采用这种方法,在写时间上,延迟也会偶尔达到40-50k ms也增加了。该解决方案目前可以使用,但绝对不是未来的证明。

我的问题基本上是以前曾与aurora合作过的数据工程师。如何处理aurora postgres的副本滞后问题,尤其是写大约5Tb的数据。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...