{DAY 2} 如何处理一笔数据?(上)

大家一定都听过数据分析
让我们先来看一笔实际的数据
点开kaggle上随意一笔csv档


(资料来源:https://www.kaggle.com/andrewmvd/heart-failure-clinical-data)

没看错,就是密密麻麻的数字跟符号
这些数据可以拿来干嘛呢?到底厉害在哪?

数据分析的用途在哪?

数据在现实生活中,主要是拿来协助决策的执行

在网际网路发达的现代,大部分的资料都以数据的形式出现

许多企业在做实务上的决策时,已经无法单纯依靠人为的决策做判断

这时候就需要利用数据分析的产出结果协助做决策

数据分析的流程

1. 首先当然是找出问题点 (Problem Defining):

此时需要明确定义出问题,确认要执行的目标

根据不同的企业应用场景,也会有不同的问题定义手法,最重要的是掌握问题的核心

以下举例常见的几种分析问题的思维:

  • 结构化思维:

    • 金字塔+MECE:金字塔化的拆解方式,将问题依照不同类别层层拆解,在每个水平层级间又依照MECE的手法,彼此独立互相遗漏的去拆解细分

    • 6W2H方法论:

      What? Why? Who? When? Where? Which? How? How much?

  • 量化思维:

    • 利用公式把问题变成可以量化的指标,像是ROI, GMV, 产品销量

还有许许多多种的分析思维,主要还是依据不同的领域和场景去选择

以下从2~4就是我在这个计画想学习的主题

把这些过程想像成做蛋糕的所有步骤

那开始一边做蛋糕,一边进入数据分析的世界吧!

2. 取得所需的数据(Data Acquisition)

在做蛋糕的过程中,这个步骤就像是准备所有食材,

有些食材是自己家里已经有的,就像有些公司会有内部的资料数据可以取得,

如购物网站本身的产品资料、消费者资料等等

还是些要另外买的,要特别出门买才能取得的材料

数据分析的世界里,则叫做从外部获取数据资料,

这就需要涉及到资料爬虫(Data Crawler),

把所有需要的东西,从外面抓抓抓到我们自己的资料库里

在蒐集完所需资料後就需要资料库来管理庞大的资料

常见的手法就是利用资料库管理系统(Database Management System ,DBMS)

此时资料库管理系统就会像是放我们所有食材的大桌子

把所有需要的食材准备好放在桌上,才能进行下一步

在这个30天计画里,我选择SQLite作爲自学资料库管理的主题,建立完整的资料库概念

学习在茫茫的资料海中,攫取有效的数据,建立解决问题所需的有效资料库

小结

这篇文章先简介了一半的数据分析流程

下篇会继续介绍剩下的分析流程


<<:  网页基础介绍及开发环境准备(DAY1)

>>:  Day02 - 语音辨识的架构、发展过程

看看是否还能进行更新

进行测试如果可以更新我会後续补上图片给大家看看挑战失败的图示 预祝各位都可以完赛 勇夺佳作 ^)^ ...

Day 7:Prometheus

讲到监控,Prometheus 应该算是最常被提及的其中一个工具,它是一套开源的监控与警报系统,最早...

Unity与Photon的新手相遇旅途 | Day27-Photon角色同步控制设定

今天内容为设定PlayerController.cs的程序码,让角色控制能够顺利同步,以及修正之前的...

day23_如何采购 ARM 版本的 Mac 呢

ARM 版本的 MAC 该怎麽买呢? 目前 APPLE Mac 在 2020年发表的 MacBook...

D25. 学习基础C、C++语言

D25. 输入输出 在C语言里,如果要输入是scanf("%d",&a)...