Youtube Data API 教学 - 告一个段落

「鲑鱼均,因为一场鲑鱼之乱被主管称为鲑鱼世代,广义来说以年龄和脸蛋分类的话这应该算是一种 KNN 的机器学习,不正经的数据分析师,毕业後把人生暂停了半年,在 Google 和 AWS 办过几场演讲,缓下脚步的同时找了份跨领域工作。偶而慢跑、爱跟小动物玩耍。曾立过很多志,最近是希望当一个有细节的人。」


Youtube Data API 教学 - 告一个段落

Youtube Data API 的教学跟使用在现阶段告一段落,最主要和最常使用的功能都已经藉着前几天的机会讲解完了,接下来我们会进入 Youtube Analytics API 的世界,在这之前我想用一点简单的介绍座桥梁做一点吸收,这篇是 Python - 数位行销的 Youtube 分析教学系列文章的第 13 篇,也是我参加 2021 iThome 铁人赛中系列文章的第 13 天,大家也可以趁着这个机会点选下方的系列文章回顾,来看看 Day1 - Day12 的所有内容。

系列文章:Python — 数位行销分析与 Youtube API 教学
昨日回顾:Youtube Data API 教学 - 那就从播放清单 playlistItems.list

关於 Data API 带给我们的一些改变

数位媒体平台的经营是现阶段的趋势,也是许多人做广告导流与社群经营的标的,顾问业、品牌端、媒体业、金融业,数位媒体就像是各个产业的交集,甚至打破的人与品牌间的界线与框架,让品牌能够与用户跟加拉近距离,各家产业已经从传统行销方式转型至社群媒体的经营 (Facebook、Instagram、Youtube、Tiktok) 也包含了品牌经营策略与广告投放策略,数位行销与生活已经密不可分且息息相关。这 30 天铁人挑战赛会从数位行销看数字的角度去重新切入数据分析这件事情,除了 Python 教学的程序开发外,我也想一点一滴地回归最初的试算表和基本统计带领大家进入Youtube 的数位行销世界。比起一口气写 Code 我更期待没有经验的小白稳扎稳打的实用在工作上,这门课除了本身的 API 应用外,我们日常工作上也会有一些工具做使用。

第 1 项实用工具 - 试算表 Microsoft Excel ( 包含 Google Sheets)

这是大家最普遍所使用到却也最容易被遗忘的工具,高效率与方便性让其立足於不败的地位,作为数据分析师 80% 的时间几乎都会需要跟 Excel 绕着打转,Excel 用到精通可以说是最基本的条件,所以回归到最入门,我们一切都从 Excel 开始讲起,基本的统计条件、统计公式与概念、各式不同的 Function 使用,稍微进阶的 Vlookup- Hlookup- 枢纽分析,到最後进阶的会聊聊 Scenario Manager、Solver 计算最大获利(经济曲线)、Goal Seek 的使用。

要注意的是,无论是 Microsoft Excel 或是 Google Sheet 对於超过百万笔的资料量都是庞大的负担,可能导致运算速度变得非常慢,根据 Microsoft 官方的规格及限制,Excel 工作表上的总列数和栏数上限为1,048,576 列乘以 16,384 栏,根据 Google Support 官方的规格限制,Google Sheet 最多只能包含 500 万个储存格或 18,278 个栏 (栏 ZZZ),这也是为什麽在大量数据分析的情形下,我们可能会倾向使用 Python。

Sheet

第 2 项实用工具 - 大数据分析处理 Python (包含 R 语言)

相较於 Excel 的在资料处理的方便性,Python 更适合用於大量数据的处理, 超过百万笔或是千万笔的资料我们更倾向使用 Python 或是 R 进行数据的处理和分析,同时搭配 Python 语言有许多方便的 Package,像是 Pandas、Numpy、Matplotlib 等等的,能够帮助我们更容易处理大量数据的应用

同时, Python 对於其他语言的支持度也非常的强,所以像是资料库储存的支援性 DB, MySQL, MsSQL, 也会非常的好,能够在 Python 上直接进行跨语言的执行与资料抓取,甚至後期我们会谈到如何把资料 update 到网页端,让数据查询可以从自己的电脑跃升到网页执行面上。

Python

第 3 项实用工具 - 机器学习与人工智慧

在更多的情况下,有些许的资料我们可能没有办法用现有的资料进行运算与预测,举例来说我现在手上有一张图,你可以说说这是什麽吗?

WriteSome

在过去 Rule-Based model 的情况下,我们会藉由方法去定义这一项物品的特徵,举例来说上面这张图,我可以认为它具有以下的特徵性质

  • (1)他具有琴身
  • (2)上长下宽的特性
  • (3)中间疑似有个圆孔
  • (4)上方有长钮
  • (5)旁边具有一个配件

综合了以上几个特徵,我会定义他为一个物品,可能是吉他,这是我们过去在程序开发 Rule-Based model 情形下可能的做法。但是对於机器学习来说,机器学习更偏向你给予了一些输入资料,而机器能够透过资料和经验中学习,并且能够找到其中的运行规则,最後达到人工智慧的一种方法目的。如同机器学习权威 Stanford 大学的 Andrew Ng 吴恩达教授所定义,「机器学习是一门让计算机在没有明确的程序设计情况下能够采取行动的科学」,我们平常所绘画的图片,可能没有办法很明确的定义说什麽样的图片叫做吉他,但是当你给予机器学习大量的图片时,他可以从中找寻规则了解他们的共同特徵,这就是所谓的机器学习

QuickDraw

机器学习与类神经网路除了绘图辨识与物体辨识外,常见使用案例也包含了﹔语音识别、声波探测、自然语言处理、语意分析、风格艺术、人脸辨识等等的。在过去的十年里,机器学习为我们提供了自动驾驶汽车、实用的语音识别、有效的网络搜索,以及对人类基因组的巨大改进。今天机器学习如此普遍,你可能每天都会使用它却不自知,这项技术既低调却又是让人类迈向新生活水平的最佳途径之一。

今天用比较轻松的方式做结束

如果有时间也欢迎看看我的夥伴们的文章:
lu23770127 — SASS 基础初学三十天
10u1 — 糟了!是世界奇观!
juck30808 — Python — 数位行销分析与 Youtube API 教学
HLD — 浅谈物件导向与Design Pattern介绍
SiQing47 — 前端?後端?你早晚都要全端的,何不从现在开始?

Jerry Chien

【鲑鱼均】 现职是 200 多万订阅 Youtuber 的数据分析师,专长在 Python 的开发与使用,大学虽然是资讯背景但总是斜杠跑到商管行销领域,以工作角度来说的话,待过 FMCG、通讯软件、社群影音产业,也算是个数位行销体系出生的资讯人。这 30 天铁人挑战赛会从数位行销角度去重新切入数据分析这件事情,期待这个资本主义的社会中,每个人能在各个角力间不断冲突而渐能找到一个平衡点回归最初的统计建立最终的初心。

下一篇:小知识 - Google Sheets 与 Excel 世仇之战


<<:  Day 14 - PHP SDK: 用 Pure PHP 建立购物网 (上)

>>:  卡夫卡的藏书阁【Book14】- KafkaJS 生产者 - 压缩 2

D6. 学习基础C、C++语言

D6: for回圈 最基本的for回圈样式是: for (变数初始值; 判断式; 递增式){ 陈述句...

学校体温自动上传爬虫(学习记录)

动机 因为疫情,这学习开始学校要求大家每天都要在九点前到学校网站上传体温,我觉得非常麻烦。 动点,果...

JS 33 - 在触控装置侦测手势的滑动方向!

大家好! 今天我们要实作在触控装置中侦测手势的方向。 我们进入今天的主题吧! 备注:前几天和今天的范...

Progressive Web App 加入主画面 : PWA 究竟加入和安装了什麽 (2)

加入主画面 (Add to Home screen) 加入主画面 (Add to Home scre...

【Day 9】Introduction - Practice 1

题目 美术馆有n 种票,票价为 p1、p2、p3 直到 pn,所需张数为 x1、x2、x3 直到 x...