尝试使用 Pyrogram/Python 获取所有聊天成员的数据时,是否有解决 10,000 个 Telegram 服务器查询限制的方法?

问题描述

我必须从 Telegram 聊天列表的所有成员(群组和超级群组)获取数据,但是,作为 Pyrogram documentation alerts,总共只能获得 10,000 个 ChatMember 结果单一查询。 Pyrogram 的 iter_chat_members 方法仅限于此,不提供 offset 参数或某种分页处理。因此,我尝试使用其 get_chat_members 方法获取 200 大小的数据块,但是在第 50 个块(对应于第 10,000 个 ChatMember 对象)之后,它开始给我空结果。我用于测试的草稿代码如下:

from pyrogram import Client

def get_chat_members(app,target,offset=0,step=200):
    total = app.get_chat_members_count(target)
    itrs = (total//step) + 1
    members_list = []
    itr = 1
    while itr <= itrs:
        members = app.get_chat_members(target,offset)
        members_list.append(members)
        offset += step
        itr += 1
    return members_list

app = Client("my_account")
with app:
    results = get_chat_members(app,"example_chat_entity")
    print(results)

我认为尽管这些方法中的任何一种都为我提供了完整的聊天成员数据,但应该有一种解决方法,因为 Pyrogram 的文档关于此限制的说明对应于单个查询。那么,我想知道是否有一种方法可以执行多个查询,而不会淹没 API,并且不会丢失偏移状态。我是否遗漏了什么或由于 API 限制而无法完成?

解决方法

这是服务器限制,而不是 Pyrogram 本身。在大约 10k 个成员之后,服务器根本不会产生任何更多信息。无论如何,用户不可能需要知道这么多成员的详细信息。