从 Google Cloud Storage 读取 PDF

问题描述

我目前在 Google Cloud Storage 中有一个包含 .pdf 文件的存储桶,我想将每个 .pdf 文件拆分为多个单页 .pdf 文件

我只能将文件加载为 BLOB (),我找不到关于如何作为 PdfFileReader 对象读取的好答案。

解决方法

从存储桶中“获取”对象/文件后,您可以将其作为字符串(字节)“保留”在云函数内存中或将其保存到本地临时“目录”(/tmp)中到您的云功能(临时目录的内存分配形成云功能可用的总内存)。之后,您可以将数据作为字符串或文件进行处理。完成处理后,您可能希望将这些文件上传到其他存储桶中。