问题描述
我的工作都是一系列需要针对每个对象进行的请求。即,它是一个 User
,其中包含需要通过请求添加到该用户的多个数据点(可能是数百个)。我最初编写这些请求以同步运行,但它阻塞且缓慢。我将每个 User
作业发送到 Python RQ,并且有 10 个工作人员通过发送到队列中的用户。 1 个工作人员,1 个用户,阻止请求。
我重新编写了我的用户作业以使用 aiohttp 而不是 python 请求,而且速度明显更快。在 Python RQ 文档中,它说“任何 Python 函数调用都可以放在 RQ 队列中”。但我不知道如何将我的异步函数发送到队列中?
async def get_prices(calls: List[dict]) -> List[dict]:
async with aiohttp.ClientSession() as session:
for price in prices.items():
price_type,date = price
price = await pg.get_price(
session=session,lookup_date=date
)
do_some_other_stuff()
await session.close()
from core.extensions import test_queue
from prices import get_prices
job = test_queue.enqueue(get_prices,kwargs={"username":'username'})
问题是从不等待 get_prices
,它只是一个协程期货......我如何在队列中等待我的函数?
解决方法
由于 python-rq
不直接支持 asyncio,您可以改用调用 asyncio.run
的同步函数。
async def _get_prices(calls: List[dict]) -> List[dict]:
# ...
def get_prices(*args,**kwargs):
asyncio.run(_get_prices(*args,**kwargs))
但是请注意,asyncio.run
仅在没有其他正在运行的事件循环时才有效。如果您希望异步循环已经在运行,请改用 loop.create_task
。
def get_prices(*args,**kwargs):
loop = asyncio.get_event_loop()
coro = _get_prices(*args,**kwargs)
loop.create_task(coro)
然后当 python-rq
调用 get_prices
时,它会导致异步函数被执行。
另一种选择是不使用 asyncio 发出请求,例如使用 grequests
、线程或类似可以与同步函数一起使用的东西。