[Day 01] 纲要

前言


HIYO!又是阿峻我啦~
不知从何时开始,Deep Learning 跟 AI 这两个名词好像越来越红的样子,红到如果你没听过大家反而会觉得你很奇怪XD从几年前的 Alphago 打败世界围棋冠军到後来 OpenAI 推出可以跟人类顶尖星海争霸玩家一较高下的模型。AI 这个名子越来越像是一个稀松平常的 Tool, 平常到像是 Tree search 等 classic 的方法随时享用就套个。而在这一股 AI 的浪潮来袭,或多或少我们都会去修个 AI 相关的课程,像是 Machine Learning 或者 Deept learning 等课程;或者去 Youtube 上看各个大神的影片讲解(首推各位印度大神!!)以及上网自行 google 一些资源。但这样东拼西凑的我们一路跌跌撞撞走到今天踩过的坑都还历历在目吗?那个查半天的 grad 到底躲去哪了?那个熬夜想方法去 check 一切 tensor 的维度到底哪里不合理?那个上网复制个指令贴到 code 里结果就喷 error 到底为何压QQQ?数不尽的辛苦泪交织着当年吵着买张 1080ti 不是去 training 而把特效全开的我们的青春。对此,面对着每年会经历过一次崩溃的新生的我突然有个冲动,想要去记录一下这一路走来到底有那些常见的坑我所步过。但这个系列没有这麽厉害,不是多麽猛的巨作或者多麽精辟的精华,所以没有丰富的内容可以跟大家说嘴,这个系列纯粹只是兴趣使然、废文没地方发以及吃太胖了手有点肿来加减动个减个手指肥,所以只是想简简单单的跟大家说说这一次我想写些甚麽,方便大家快速判断要不要关掉这个网页 XD 对於大神们,我所经历过的坑怕事只是无病呻吟吧XDDD (大神 OS : 这是坑!?那竹湖不就是太平洋了XDDD太平洋就银河了XDDDD)

没啥用的废文,按下叉叉就对了!
- 阿峻 20190917

凹特烂


本系列文主要是想要从机器选择系统环境建置到架设 model 、 training 到最後一些实务上可以讨论的点,结合着这几年当 DL 助教所遇到的各种神奇的错误以及不敢说最佳但大致 OK 的解法,各位路过的大神还请不吝惜给点正解 ><
ok 说到这里,为了跟还没有离开这个系列文的你尽可能解释我想要讲的主题,以下为以条列式的方式纪录每个 Topic以及放一些小标作补充说明,就当作是许愿也好,说不订这个系列文打着打着我就懒了停更XD 而各个 Topic 基本上拿去 google 去查相关 key word 就可以查到一对巨巨写的巨着>< 但最後注记一点,本系列不会细讲数学,若是想看看 Deep learning 的数学的勇士还是请左上按叉去翻个Ian Goodfellow 的 "Deep Learning" 或者 CM Bishop 的 "Pattern Recognition and Machine Learning" 或者各校开授 DL 的教授开的课程XDDDD
以下不是奥特曼是凹特烂:

  • 简介
    • 就本篇废文啦XD废到不忍直视XD
  • Python/环境
    • 基本的Python语法以及简单的实作环境介绍,含机器挑选资讯以及灌好环境等等,有写好参考 Script 别慌><
  • Pytorch/Torchvision简介
    • 介绍一下我们後续要用的知名 Deep learning library以及一些好用的官方资源库,像是 torchvision 等。以介绍为主,顺道有空的话来科普一下八卦XD 但基本上本章资讯去查 google 应该一堆。
  • 各式经典 Model 介绍以及其应用
    • 主要去提一下四个基点且常见的 Model 类型:CNN 、 RNN 、 VAE 、 GAN ,数学依据情况看可以提多少,并且每个 Model 都会附上实作以及应用 Task,像是怎麽用 Pytorch 来刻一个能动的模型,使用 Torchvision 内建的 Dataset,然後一起重温当年看着进度条咻咻咻的变长嘿嘿嘿傻笑的成就感,但同时也提一下常见的 Issue 以及相关 Paper 连结。
  • Model 的优化/训练小技巧/测试
    • 费尽千辛万苦写好 Model 并且跑完 Training 了,但那个 Performance 有时可悲到就像是要去跟教授咪挺的我,咪挺前信心满满但开咪时一扁就倒QQ 此章节就是想要来谈谈各个优化的方法以及一些 training / testing 的 issue,像是 overfitting 或者 underfitting 等等,还有纪录一些有趣的 Training 小技巧、小工具啦,但讲良心觉得你不如放一包乖乖比较有效(?
  • Model Debug
    • 以前学基础程序出错不是自己底霸格就是求助教指出一条人生的明路XD,但随着时间推移,我们底霸格的方法也可以更加的聪明,不用再像是年轻懵懂的我们每个变数都 print 看看XD(但不可否认这个很直接有效),但那种自己 Dataflow 没拉好 code import 错 library 的那种请自行去看眼科谢谢><
  • Model Deploy、GPU 简介、数据观察以及选择
    • 说说 Model 的部署等议题,像是再跑的时候 GPU 的一些 issue ,求别像我学弟打开 Nvidia-smi 只会看温度我真的很无奈,跟我说数字越多越大越猛 = = 还跟我说他想要看起来会发光的显卡 XDQQQ
  • 多GPU计算、分散式计算
    • 虽然俗话说有朋友赢一半,尽管现实中我没有甚麽朋友QQ,但人家 GPU 没像我这麽鲁QQ 基本上我是看别人跟别人相处的模式写个心得啦
  • 比赛、练习、资源
    • 你是不是一直在想甚麽时候可以把这个网页关掉换其他比较有用的网页看看,有啦有啦这里有纪录一些啦
  • 其他未定
    • 目前没想到 XDDDD 等之後再说

好啦以上大概就这样,但随着心情会修修改改啦,总之欢迎订阅~
那就看看这 30 天我可以写多少罗XD
我们明天见!


<<:  铁人赛 Day16 -- 前端工程师一定要会的 -- RWD响应式网页 @media 媒体查询

>>:  Day 16 读 Go Concurrency Patterns - Rob Pike III

计画赶不上变化的第一篇

这一届的 IT 铁人赛,本来排开了很多事情,想要来挑战4个题目,还为了影片组买了一些器材。 但果然,...

Day27 建立使用者及Claim功能

前面说过ASP.NET Core Identity 是基於 Claim 的验证,而 Role 就是型...

Day3 Redis服务器环境设定

作业系统配置 因为Redis Server是在记忆体进行所有的操作,故需要优先在作业系统中配置记忆体...

Day 39 (PHP)

1.阵列:一、二、三维 $a[0] = 123; // 一维 $a[1][0] = 10; // 二...

LeetCode解题 Day17

350. Intersection of Two Arrays II https://leetcod...