Lambda 上的 Apache Tika

问题描述

我已经能够在 AWS ECS 上将 Tika 服务器的 Docker 预构建映像作为 Fargate 任务运行。我现在想让 Tika 服务器(或等效功能)在 AWS Lambda 上运行。在请求到达 Lambda 之前,请求最初会通过 AWS API Gateway(HTTP 代理集成)。我绝对理解 Lambda 在大负载(即超过 6 MB)和时间限制(最多 15 分钟)方面存在问题,但我们计划使用 specifying the URL functionality 并且我们相信 Tika 不应该需要 15 分钟或更长时间提取一个文件。在 Lambda 上运行 Tika 可以实现更好、更轻松的可扩展性以及一些安全改进。

这种方法的难点在于 AWS Lambda 运行时让所有请求都通过一个 Lambda 处理函数。因此,不能只使用 Lambda 容器镜像,而是使用预先构建的 Lambda Docker 镜像。

我可以在 Lambda 处理函数中编写一堆代码来解析进入 Lambda 的请求,然后调用相应的 Apache Tika API 作为库。但是,我相信这需要大量代码

一个选项可能是编写 Lambda 处理程序函数以使用 Lambada framework。然而,这个框架处于测试阶段,似乎是一个死项目(最后一次提交是在三年前进行的)。此外,我不确定如何将 Lambada 与 Tika 一起使用。

如果我想让 Tika 在 Lambda 上工作,可用的最干净和最简单的选项是什么?

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)