大家好~昨天我们建立好 Google Analytics 与 AWS 连线,现在我们就可以透过 AWS Console 拉取 Google Analytics 资料
大致流程如下所示:
这里是定义抓取的 Google Analytics 资料要存放在哪里
所以我们这边选择 Destination name 为 AWS S3、Bucket details 选择昨天创建的 S3 Bucket name,接着展开 Additional settings
选择完後,蓝底的地方就会显示目前资料夹的命名阶层:
S3://<<"bucket name">>/<<"appflow name">>/年/月/日
可以选择按排程、基於事件或手动触发,这边我们选择 Run on demand (手动触发)
选择 Manually map fields,并选取欲拉取的 Google Analytics 栏位(栏位说明请详[1]),这边我想了解不同的装置在网站的网页浏览量,故选取
ga:date|DIMENSION、ga:deviceCategory|DIMENSION、ga:pageviews|METRIC,并点选 Map fields directly 後按 Next
★小叮咛★ 因有部分栏位无法直接选取(ex:ga:dimensionXX),可以选择『Upload a .csv file with mapped fields』,就可以导入自定义维度和指标。
我们可以设定筛选条件过滤要储存的资料,我们选择跳过按 next、save
接着我们点击此 Flow 并点选 Run Flow
等待 Flow 执行完成後,我们可以在 S3 看到抓取的 Google Analytics 资料~接着我们下载这个档案看里面的内容,我们会发现抓取的 Google Analytics 原始档案为多行的 JSON 格式,非常不方便使用者阅读且 Athena 也不支援此格式搜寻,让我们无法进行後续的分析处理
我们要如何解决此问题呢? 就让我们明天继续讨论 Data Analytics Pipeline on AWS - Google Analytics 吧~ 明天见:)
如果有任何指点与建议,也欢迎留言交流,一起漫步在 Data on AWS 中。
[1] UA Dimensions & Metrics Explorer
https://ga-dev-tools.web.app/dimensions-metrics-explorer/
今天接续昨天的Array方法 那我们开始吧!! splice() 可以新增删减阵列项目,也能指定位置...
挑战心情 至今天为止,持续每天看 csscoke 的影片学习 CSS 金鱼都能懂的网页教学及金鱼都能...
Template Syntax Vue.js 最主要是基於HTML,在使用JQuery或者Js的时候...
1. 什麽是元素显示模式 元素显示模式就是元素(标签)以什麽方式进行显示 作用 : 网页的标签非常多...
上上篇已经写了一个Flask API的Hello World, 现在我们的Flask API要开始串...