【Day 23】 AWS Kinesis - Data Streams vs Data Firehose 两者差异

前几天我们已经启用 VPC Flow Log、CloudFront Log,接下来我们就是要来实作 - 『如何启用 WAF 日志以及汇入 BI 进行分析』,Data Analytics Pipeline 如下图所示:
https://ithelp.ithome.com.tw/upload/images/20211007/20131073JERXJNIjk8.png

大家会发现蒐集 WAF Log 的 Pipeline 流程跟 VPC Flow Log、CloudFront Log 不太一样,若要蒐集 AWS WAF Log,我们需要透过 Kinesis 服务来蒐集串流资料并指定其存放的目的端(例如:Amazon S3、Amazon Redshift、Amazon Elasticsearch Service 和 Splunk ),接着建立 WAF Log 的 Data Catalog,让 Athena 可以查询以及 QuickSight 进行资料视觉化


那这个实作是透过 Kinesis 服务来蒐集 Log,那其实 AWS Kinesis 服务有分成几个类别,那到底我们应该使用哪个类别的 Kinesis 服务呢? 所以我们先来讨论这几个类别的差异
AWS Kinesis 是一个可轻松地收集、处理和分析即时串流资料,让您及时取得深入的见解并快速地对新资讯做出反应,而 AWS Kinesis 又可以区分成以下四种类别:
https://ithelp.ithome.com.tw/upload/images/20211007/20131073ikq5nWGXPl.png

第一个 Kinesis Video Streams 跟第四个 Amazon Kinesis Data Analytics
我们可以从字面上去了解就是与影音/即时串流分析有相关,我们就不深入讨论


而第二个 Kinesis Data Streams 和 第三个 Amazon Kinesis Data Firehose 这两个到底差别在哪里? 看文件好像两个都是用来轻松地收集、处理即时串流资料说… 故针对不同的构面,整理了以下差异来了解这两者到底差在哪里~ [1]

构面 Kinesis Data Streams Kinesis Data Firehose
处理能力 低延迟串流服务,可在资料收集後的70 毫秒内准备就绪,将串流资料提供给多个即时分析应用程序、S3 或 Lambda 它可以在串流资料传送到服务之後的60 秒内传送到 AWS 服务
管理 为托管服务,但还需要配置 shards 全托管服务
资料储存 可以储存 1 到 7 天的资料,以解决未能即时处理的资料 没有提供资料储存的功能
扩展能力 需要透过 shards,配置手动管理缩放 可以依据使用者的需求,提供自动扩展的功能
目的端 传至可处理纪录的服务,像是:Amazon Lambda、EC2、Spark on EMR、Kinesis Data Analytics 传至资料存放区,像是:Amazon S3、Splunk、OpenSearch Service和 RedShift 等

所以在 AWS 中若要抓取 WAF Log 并储存到特定资料存放区,我们则会使用 AWS Kinesis 服务的 Data Firehose 来协助我们抓取串流资料并储存到 AWS S3 中~

今天就先这样,明天我们就会来实作『如何启用 WAF 日志』,明天见罗 : D ~

如果有任何指点与建议,也欢迎留言交流,一起漫步在 Data on AWS 中。

参考&相关来源:
[1] AWS Kinesis Data Streams vs Kinesis Data Firehose
https://jayendrapatil.com/aws-kinesis-data-streams-vs-kinesis-firehose/


<<:  [Day29] swift & kotlin 上架篇!(3) 双平台 上架比较

>>:  Day25 Matrix

Day 24. slate × Normalizing

在开始继续深入源码之前,我们先花点篇幅讨论 Normalizing 这回事。 Normalizin...

5. bind, call, apply 的差异

在回答问题前,我们可以先了解他们是做什麽用的,为什麽总是拿来被比较? 这里要先回忆一个观念: JS里...

Smalltalk 语言和你 SAY HELLO!!

第二十九天 各位点进来的朋友,你们好阿 小的不才只能做这个系列的文章,但还是希望分享给点进来的朋友,...

Day10:例外处理,留下来或我跟你走

程序在执行的时候,有些时候我们会遇到一些例外的情况,我们一般会使用 try-catch 来拦截程序执...

13 出牌倒数要怎麽做才好?

整理一下算分数方法 这个方法实在太扯了,他很明显的有分成三个区块, 用 round 拿到该范围的卡 ...