Day1 - 导读 带你认识资料科学所需套件

先备知识:

  1. 基本python能力 :

    熟悉各基本型态,认识串列、字典、函式、class

  2. 了解深度学习原理:

    需要具有深度学习的基本知识,那需要到什麽程度呢?
    基本上只要看懂李宏毅老师在youtube的Machine Learning (2021) Mandarin Version这播放清单的前8部影片

依照下列顺序介绍各套件:

  1. numpy:

    认识多维资料及各numpy方法,有利於之後操作pandas的DataFrame。

  2. pandas:

    大部分的资料都会使用此套件来操作,检视资料状况、资料型态转换,补充缺失直、范围切割等。

  3. seaborn:

    资料视觉化的强大套件,与pandas配合起来便利又轻松,pandas与seaborn的相互操作非常有利於我们对於资料的探勘。

  4. sklearn

    在此套件里提供了许多资料前处理方法及机器学习套件,本篇注重於如何使用sklearn的资料前处理方法,如果30day我写到没东西可以写了,将利用剩余天数介绍如何使用sklearn机器学习套件,例:SVM、随机森林、决策树、clustering等

  5. pytorch

    深度学习套件,不多说了 哼~

最後专案实际操作:

最後带领大家使用以上所学 实际操作Kaggle Titanic 进入排名前5%
https://ithelp.ithome.com.tw/upload/images/20210823/20140416ha8oHtd5tF.png

作者的话:

第一次参加IT铁人赛,将尽可能的分享我所学知识
本人依旧还在学习阶段,过程可能会有错误资讯请多多包涵


<<:  Day 1. 前言

>>:  Day 03 : ML in Production 的挑战

【Day09-填空】漏漏缺缺欠欠填填删删补补——面对缺失值的处理方式

昨天我们讲了在numpy中NaN要如何判断相等 那今天就来稍微谈一下会出现缺失值的那些情况要怎麽处理...

D22-(9/22)-长荣航(2618)-差了一个字,就是涨倍和涨十倍的差别

注:发文日和截图的日期不一定是同一天,所以价格计算上和当日不同,是很正常的。 声明:这一系列文章并无...

损失函数的演进--2

triplet loss 接下来的Loss function为triplet loss 是为2015...

【Day 6_ Arm的开发者友善工具组Arm Mobile Studio】

前几篇文章中提到Arm除了推出许多专为优化游戏体验而生的解决方案外,也致力於协助游戏开发者在制作游戏...

Day26 - GitLab CI 启动其它专案启动流水线或动态产出新的流水线,谈触发 trigger

在大型专案中,可能会把专案依功能、架构等等因素,切分为多个子专案,虽然切分为多个子专案,有些逻辑可能...