如何使用Azure Synapse Spark池写入Cosmos DB

问题描述

是否可以在Azure Synapse中使用Spark环境使用Gremlin API将数据写入Azure Cosmos DB?我们需要在Cosmos中构建graph db,但是由于我们已经在使用Azure Synapse,所以我们希望避免为Databricks等其他工具付费。

谢谢。

解决方法

不幸的是,您不能使用Azure Synapse内的Spark环境通过Gremlin API将数据写入Azure Cosmos DB。

Azure Synapse链接可用于 Azure Cosmos DB SQL API 容器或用于 Mongo DB 集合的 Azure Cosmos DB API。

Synapse Link for Azure Cosmos DB是一种云原生混合事务和分析处理(HTAP)功能,使您可以对Azure Cosmos DB中的操作数据进行近乎实时的分析。 Synapse Link在Azure Cosmos DB和Azure Synapse Analytics之间建立了紧密的无缝集成。

今天(即2020年9月22日),您可以对MongoDB集合中的数据运行Spark查询,而不会影响OLTP工作负载和ETL。从下个月开始,您还可以使用Synapse SQLless server运行T-SQL查询,并使用Power BI在直接查询模式下针对这些数据构建实时BI仪表板。

enter image description here

参考: Support for Azure Cosmos DB API for Mongo DB in Azure Synapse Link