如何从pandas数据框创建数据表?

问题描述

我有一个已创建的熊猫数据框。可以很好地打印出来,但是我需要在sql中进行操作。

我运行了以下内容

spark_df = spark.createDataFrame(df)

spark_df.write.mode("overwrite").saveAsTable("temp.testa")

pd_df = spark.sql('select * from temp.testa').toPandas()

但是出现错误

AnalysisException: Database 'temp' not found;

很显然,我还没有创建数据库,但是不确定如何做。

有人可以建议我如何去实现我所需要的吗?

解决方法

该错误消息明确指出“ AnalysisException: Database 'temp' not found;”未找到数据库温度。创建数据库后,您可以毫无问题地运行查询。

要创建数据库,可以使用以下命令:

要在SQL中创建数据库,请执行以下操作:

CREATE DATABASE <database-name>

enter image description here

参考:Azure Databricks - SQL