[Day 9] Course 3_Prepare Data - 资料型态

《30天带你上完 Google Data Analytics Certificate 课程》系列将透过30篇文章,和各位分享 Google Data Analytics Professional Certificate 课程的心得与笔记,希望对资料分析有兴趣的朋友,能藉由这些分享,对此领域更深的认识与了解。

若对於文章主题或内容有任何建议,也欢迎留言给予宝贵的意见,谢谢:)

在之前三篇文章(Day 6 - Day 8)分享了 Google Data Analytics 课程中所订定的资料分析流程的第一步:Ask 提问,介绍到如何在第一个阶段透过有效的提问,明白定义利益相关者的问题,是非常重要的开始。

接下来将要继续介绍资料分析流程的第二步:「准备 Prepare」,在定义清楚问题之後,接着就是要来准备所需的资料。而本篇文章会先介绍基本的资料型态。
https://ithelp.ithome.com.tw/upload/images/20210909/20130448I1tHfzSvmk.png

资料蒐集

当资料分析师清楚明白所要解决的问题为何之後,接着就是要来蒐集即将用来分析的资料。一般来说资料会透过以下几种方法被蒐集:

  • 访谈
  • 观察
  • 表格填写
  • 问卷
  • 调查
  • 浏览器 cookie

而资料分析师在规划蒐集资料时,会需要经过以下几点的考量:

  1. 挑选正确型态的资料
  2. 定义范围(使用原有资料 vs. 蒐集新资料)
  3. Where?
    • 使用原有资料 → 选择资料来源
    • 蒐集新资料 → 决定如何蒐集资料
  4. How?
    • 使用原有资料 → 决定使用什麽资料
    • 蒐集新资料 → 决定要蒐集多少资料(母体数与样本数)

资料来源

  • 第一方资料:由个人或团体本身拥有的资源来蒐集的资料
  • 第二方资料:由团体直接从其客户蒐集而来随後卖掉的资料
  • 第三方资料:从外部来源而非直接蒐集而来的资料

资料形式 Data Format

定性资料 vs. 定量资料

  • 定性资料(Qualitative Data):对品质及特徵的主观且解释性的测量
  • 定量资料(Quantitative Data):对数值事实的特定且客观的测量

离散资料 vs. 连续资料

  • 离散资料(Discrete Data):可计数且有限量的值
  • 连续资料(Continuous Data):被测量且可以有几乎任何数值

名目资料 vs. 顺序资料

  • 名目资料(Nominal Data):被没有一定顺序分类的定性资料
  • 顺序资料(Ordinal Data):有一定顺序的定性资料

内部资料 vs. 外部资料

  • 内部资料(Internal Data):存在於公司内部系统的资料
  • 外部资料(External Data):存在於组织外且在组织外生成的资料

结构资料 vs. 非结构资料

  • 结构资料(Structured Data):以特定形式(如行与列)整理的资料
  • 非结构资料(Unstructured Data):没有被任何简易辨别的方式整理的资料

随堂小测验

每篇文章最後都会有随堂小测验,正确答案将於下一篇文章提供。

  • 上周的小测验解答:
    • [选择题] 利益相关者已要求资料分析师尽快产出报告。以下哪些选项的策略是资料分析师可以采用,确保工作不会太敢且能正确回答问题,并交付有用的结果?
      • 重构问题
      • 列出问题
      • 随便做个报告应付
      • 对时间轴设定明确的期待
    • 答案:
      • 重构问题
      • 列出问题
      • 对时间轴设定明确的期待
  • 本周小测验
    • [选择题] 电影的放映时间长度是属於以下哪种资料?
      • 名目资料
      • 顺序资料
      • 连续资料
      • 离散资料

<<:  从 IT 技术面细说 Search Console 的 27 组数字 KPI (9) :连结 - 外部连结

>>:  #9 - Creating & Removing Directories

D-29. 常数, 变数, 符号, 数字 && Leetcode : Power_of

资料型态 多数程序语言的学习第一步常为了解资料型态,毕竟分不清楚资料的型态的话,就不可能对资料做出正...

身为与会者,控场的重要性

会议中的每个人都是可以掌控会议的节奏,因为谁也不知道控场的人哪一天也自己不受控制。因应疫情,所以先从...

[神经机器翻译理论与实作] 从头建立英中文翻译器 (III)

前言 今天的内容依旧为训练翻译 seq2seq 神经网络的历程( training process ...

[小故事]跌破众人眼镜! 聊聊 JavaScript 的封王之路

欢迎来到 Ian 的知识讲堂,本篇会用说故事的方式跟大家聊聊全端宠儿 - JavaScript 的小...

LeetCode 解题 Day 03

587. Erect the Fence https://leetcode.com/problems...