Streams和Firehose的用例是什么？

我正在开发一个将读取和分析付款交易日志的应用程序。我知道我会根据自己的需求使用Kinesis Analytics，它会从数据流和Firehose中获取输入。但是我在确定我的系统应该使用哪种输入方法时遇到了麻烦。 我的要求是：

哪个输入流适合我的用例？

Kinesis Stream（KS）和Firehose（FH）之间有一些主要区别：

从您写的内容来看，我认为应该首先考虑FH，因为您并不担心FH的非实时性，它更易于管理和设置，并且可以specify S3 as a backup处理失败或所有消息：

Kinesis Data Firehose使用Amazon S3 仅备份所有尝试传送到您所选目的地的数据。

如果传递或lambda处理失败，则S3备份可确保您不会丢失记录。随后，在我看来， Firehose很好地解决了您的两点问题。

数据流与Firehose

Kinesis数据流允许消费者读取流数据。它为您提供了很多选择。最适合需要自定义处理，流处理框架选择和亚秒级处理延迟的用例。数据可靠地存储在长达7天的流中，并分布在3个可用区中。

Kinesis Firehose用于加载流数据到目标目的地（S3，Elasticsearch，Splunk等）。您还可以在将流数据加载到目标之前对其进行转换（通过使用Lambda）。尝试失败的数据将保存到S3。

因此，如果您的目标是仅在尝试Kinesis Firehose时仅以最少的预处理或不进行任何预处理就将数据加载到Kinesis Data Analytics服务。

请注意，选择适当的服务时，您还需要考虑成本，开发工作，扩展选项，数据量等方面。

您可以使用 firehose 进行分析，但问题是 firehose 如何获取数据？您可以编写自己的代码来提供数据或使用 kinesis 数据流。 Firehose 主要是流数据的传输系统，可以写入到各种目的地，例如 S3、Redshift 或其他具有执行数据转换能力的可选能力。