如何在Code Workbook中访问数据集的旧事务?

问题描述

在Contour中,您可以通过单击顶部的“版本”按钮来访问旧交易。

如何在代码工作簿中执行此操作?

解决方法

您可以创建一个模板,以将transaction_idbranchdataset引入,如下所示:

def time_machine():

    from pyspark.sql import SQLContext
    sql_context = SQLContext(spark.sparkContext)

    transaction_id = '{{{transaction_id}}}'
    branch = '{{{branch}}}'
    path = '{{{path}}}'
    return sql_context.sql("SELECT * FROM `%s:%s@%s`.`%s`" % (transaction_id,transaction_id,branch,path))

在代码工作簿中,您将创建一个新的转换并从模板开始,以导入所需的事务。

但是请务必检查您的保留政策!如果您的保留政策已删除旧交易,您将无法拉入旧交易。