问题描述
是否可以使用 Pyspark+sql 从 Azure 突触工作簿对 sql 服务器数据库执行“SELECT”语句查询?
我能够将数据从 sql Server 数据库提取到 Azure Synapse 的唯一方法是创建集成管道。
我刚开始使用 Azure Synapse 和 Apache Spark,因此非常感谢您提供的任何建议。
解决方法
这在理论上是可行的,我已经使用 Azure SQL 数据库进行了测试。我不是 100% 确定它可以与 SQL Server 一起使用。这将需要网络安全是正确的,并且两个数据库之间应该有一条视线。例如,您的 SQL Server 是否在 Azure 中,它们是在同一个 vnet 还是对等 vnet 上?
Synapse notebook 中的一个简单示例:
wp_strip_all_tags()
我的结果:
受 Jovan Popovic 这篇博文的启发:
出于兴趣,您在笔记本中这样做有什么特殊原因吗? Synapse 管道是一种完美的实现方式,典型的模式是将数据暂存到数据湖中,例如,您是否需要使用笔记本来实现某些特殊功能?