问题描述
我正在使用 modin 读取 sql 表,但是我收到此警告
import pyodbc
import sqlalchemy as sal
from sqlalchemy import create_engine
import modin.pandas as pd
from distributed import Client
client = Client()
UserWarning: Port 8787 is already in use.
Perhaps you already have a cluster running?
Hosting the HTTP server on port 57475 instead
我是使用 modin 的新手,无法弄清楚发生了什么,Jupyter Lab 慢了 5 分钟,然后加载了数据帧,有什么建议/建议吗?
解决方法
您似乎正在使用 Modin,其中在导入时正在发生引擎初始化,即此时 import modin.pandas as pd
。之后就不需要自己创建 dask 客户端了,因为 dask 环境已经初始化好了。但是如果你想自己创建dask客户端,你只需要移动几行:
import pyodbc
import sqlalchemy as sal
from sqlalchemy import create_engine
from distributed import Client
client = Client()
import modin.pandas as pd # Modin will connect to current dask environment
这有意义吗?