[Day27] AWS Data Pipeline

AWS Data Pipeline 是一种 Web 服务，可协助您以指定的间隔，可靠地在不同 AWS 运算与储存服务以及内部部署资料来源之间处理和移动资料。使用 AWS Data Pipeline，您可以时常从资料的存放处直接存取、大规模转换和处理这些资料，并将结果有效率地传输到 Amazon S3、Amazon RDS、Amazon DynamoDB 和 Amazon EMR 等 AWS 服务。

AWS Data Pipeline 可协助您轻松地建立容错、可重复且高可用性的复杂资料处理工作负载。您不用担心如何确保资源可用性、管理内部任务相依性、发生暂时性故障或逾时问题时重试个别任务，或建立故障通知系统等事项。AWS Data Pipeline 还可让您移动和处理之前在内部部署独立资料区块中锁定的资料。

您也可以定义先决条件，检查资料是否可用，再启动特定活动。在上述范例中，您可以在 S3DataNode 设定先决条件，检查日志档是否可用，再启动 HiveActivity。

AWS Data Pipeline 处理：

任务的排程、执行和重试逻辑。
追踪商业逻辑、资料来源和之前处理步骤之间的相依性，确保满足所有相依性之後才能执行您的逻辑。
传送任何必要的失败通知。
建立和管理您任务所需的任何运算资源。

<<: [Day 28] HDFS

>>: Day 26: 载入图片

[Day27] AWS Data Pipeline

Day 27 - [实战练习] Pricing Sections

SSL 凭证制作与汇入

[DAY 07] 牛墟婆婆肉粽蛋饼

[Python] 关键字yield和return究竟有什麽不同?

[Day2] ＭacOS - 操作上手

Day 3 - 用 canvas 复刻小画家画笔

铁人赛Day28-第八章：恐龙在草地上奔跑吧！

day7 我不要了，这不是肯德基 cancel

Day29 - 【概念篇】用Keycloak学习JWT权杖格式 - JWT权杖格式介绍(1)

Day 16 - Array Methods