链式可迭代对象的tqdm进度栏

问题描述

如果我想在Python中组合两个迭代器,一种方法是使用itertools.chain

例如,如果我有两个范围df['new_column'] = df.column1.apply(lambda x: len(str(x).split(' '))) column 1 Camiseta Tecnica hombre barata deportivas calcetin hombres running Camiseta Tecnica mejores deportivas running Camiseta ,则可以用range(50,100,10)得到一个范围range(95,101)

[50,60,70,80,90,95,96,97,98,99,100]是Python中的可扩展进度条。但是,认情况下,即使固定了itertools.chain(range(50,10),range(95,101))表达式,它似乎也无法计数。

一种解决方案是将范围转换为列表。但是,这种方法无法扩展。

是否可以确保tqdm理解链式迭代器?

itertools.chain

解决方法

这与其说是一种解决方法,不如说是一种解决方法,因为看起来 tqdm 现在无法处理它。但是,您只需找到链接在一起的两个事物的长度,然后在调用 total= 时包含参数 tqdm

from tqdm import tqdm
from itertools import chain

# I started with a list of iterables
iterables = [iterable1,iterable2,...]

# Get the length of each iterable and then sum them all
total_len = sum([len(i) for i in iterables])

# Then chain them together
main_iterable = chain(*iterables)

# And finally,run it through tqdm
# Make sure to use the `total=` argument
for thing in tqdm(main_iterable,total=total_len):
    # Do stuff