问题描述
我有一个火花连接器笔记本,“将表导出到数据库”,可以将火花表数据写入Azure SQL数据库。我有一个主笔记本,该笔记本调用spark连接器笔记本并行编写许多表。如果复制失败,则我的主笔记本中有一个重试部分,可以重试导出。但是,这会导致数据库重复,因为原始数据库失败并不会立即取消连接。我想在每次重试之前添加一个等待时间。我该怎么办?
split
解决方法
添加Thread.sleep是解决方案
def runWithRetry(path: String,timeout: Int,parameters: Map[String,String] = Map.empty[String,String],maxRetries: Int = 2) = {
var numRetries = 0
while (numRetries < maxRetries){
tryNotebookRun(path,timeout,parameters) match {
case Success(_) => numRetries = maxRetries
case Failure(_) => {
Thread.sleep(30000)
numRetries = numRetries + 1
}
}
}
}