「鲑鱼均,因为一场鲑鱼之乱被主管称为鲑鱼世代,广义来说以年龄和脸蛋分类的话这应该算是一种 KNN 的机器学习,不正经的数据分析师,毕业後把人生暂停了半年,在 Google 和 AWS 办过几场演讲,缓下脚步的同时找了份跨领域工作。偶而慢跑、爱跟小动物玩耍。曾立过很多志,最近是希望当一个有细节的人。」
这篇是 Python - 数位行销的 Youtube 分析教学系列文章的第 6 篇,也是我参加 2021 iThome 铁人赛中系列文章的第 6 天。YouTube Data API 的开放是划时代的改变,我们有了更加弹性的资料运用方式,能够更灵活的追踪每一部 Youtube 影片的观看次数、留言数、,时时刻刻分分秒秒的,追寻着资料的变动。
系列文章:Python — 数位行销分析与 Youtube API 教学
昨日回顾:Youtube Data API - 抓取你的金钥 API key
再接续 Google-api-python-client 的 Library介绍後。接下来将要开始介绍 Search 中的类别分布,在 Youtube 上,我想要追踪一个频道,或是说一部影片他的影片点击次数、流量追踪、想要追踪留言内容,都会有其不同的追踪方式,我们在一开始就需要很明确地去定义要抓取怎麽样子的资料类型,一般来说我们分为五大类:
接下来关於 part 分类,我以我最喜欢的 Youtuber 叶式特工 (Yes Ranger) 来做范例,这边以“Minecraft Real POV 创世神第一人称真人版”这部影片为范例,我们可以从网址列中知道这部影片的网址,我们从网址後面的 v 可以知道,这一部影片的 Video ID 即是 K10nXmru-4 。
影片的基本资讯需要藉由 Snippet 来取得,这也是我们最常使用的 part 方法,通常要取得跟影片有关联的资讯都需要这个 part 来获得根据这个基本资讯可以回传到的内容包含:影片的发布时间(publishedAt)、频道序号(channelId)、频道名称(channelTitle)、影片标题(title)、影片描述(description)、影片的缩图、影片 Tag 标签资料(tags)
request = youtube.videos().list(
part= "snippet",
id= "-K10nXmru-4"
)
详细内容资讯 contentDetails 是用来取得进一步的资讯,其中最常被取得的会是影片的定义方式,包含影片画质(definition)、还有凭证(licensedContent)
request = youtube.videos().list(
part= "contentDetails",
id= "-K10nXmru-4"
)
嵌入回应式影片的方法被普遍应用在网页设计的领域中,在YouTube 原先所设定的嵌入语法中可以看到该部影片的宽度(width)和高度(height),我们也能够获得嵌入回应的网址(src),得到影片框架的相关资讯,藉由这方法可以快速的建立影片部署。
request = youtube.videos().list(
part= "player",
id= "-K10nXmru-4"
)
影片的统计资料通常会藉由 statistics 的方法来取得,这是我们最常使用的 part 方法,通常要取得跟影片有关的数值统计资料都会需要使用到这个 part ,根据这部影片的资料,我们可以得到的内容包含:影片的观看次数(viewCount)、喜欢数(likeCount)、不喜欢(dislikeCount)、留言次数(commentCount),本部影片的点击次数即为 258,882,029 次,会抓取你使用这个 API 时的影片次数为基准。
request = youtube.videos().list(
part= "statistics",
id= "-K10nXmru-4"
)
影片的性质有许多种,甚至包含了公开非公开的影片,status 这个方法能够知道这部影片的发布状态,以及一些影片基本设定,通常来说较少做使用。
request = youtube.videos().list(
part= "status",
id= "-K10nXmru-4"
)
整体来说大概会是这样子,这五种方式是我们在抓取 Data API 时,能够使用的设定类型方法。
谢谢你的阅读,如果有时间也欢迎看看我的夥伴们的文章:
lu23770127 — SASS 基础初学三十天
10u1 — 糟了!是世界奇观!
juck30808 — Python — 数位行销分析与 Youtube API 教学
HLD — 浅谈物件导向与Design Pattern介绍
SiQing47 — 前端?後端?你早晚都要全端的,何不从现在开始?
【鲑鱼均】 现职是 200 多万订阅 Youtuber 的数据分析师,专长在 Python 的开发与使用,大学虽然是资讯背景但总是斜杠跑到商管行销领域,以工作角度来说的话,待过 FMCG、通讯软件、社群影音产业,也算是个数位行销体系出生的资讯人。这 30 天铁人挑战赛会从数位行销角度去重新切入数据分析这件事情,期待这个资本主义的社会中,每个人能在各个角力间不断冲突而渐能找到一个平衡点回归最初的统计建立最终的初心。
下一篇:Youtube Data API 教学 - 频道资料我都要 search.list
前言 今天目标是把签章包成api的方式做完 一样是透过nodejs的express实作喔 实作 上图...
在你要执行(新建)一个容器的时候,你就需要有映像档。映像档是一个模版,让 docker 知道要基於怎...
序言 铁人赛开赛啦!说自己不担心能不能写完全程肯定是骗人的.......但是第1天嘛! 希望能有个好...
让我们用上一个范例来做相关分析的练习 有一位学生想知道每天读书时间与考试成绩之间的线性相关程度,所以...
这篇我是在讨论提供反馈 (giving feedback)。但对主管来说,如何接受反馈 (takin...