具有未知但有限元素的源是否被视为 BoundSource 或 UnboudSource?

问题描述

具有未知但有限元素的 Source 是否被视为 BoundSource 或 UnboudSource?

如果我能够同时实现 BoundSource 和 UnboudSource,哪个“更好”? “更好”是指哪个会提供更多选择或更好的性能

我要抓取一个分页的网站,所以一开始我不知道要抓取多少个页面,但是,我确定它不是无限的。

解决方法

BoundedSource 将允许您将作业作为批处理作业运行,这可能会更快。在这里使用 UnboundedSource 的唯一原因是,如果您想在读取数据时处理数据,而不是在读取完所有数据后立即处理。