范例一:使用MNIST资料进行训练与模型部署

在第一个范例中将会使用MNIST手写办识资料集进行训练与模型部署.

MNIST说明

MNIST database((Modified National Institute of Standards and Technology database)里面有手写数字的图片, 是由美国国家标准暨技术研究院所收集, 可以参考这个网站

会使用MNIST的原因, 一来这个资料集的资料size不会占用过多储存空间(大约需要20多MB), 另一方面目前已有很多MNIST的资料可以看参考, 是初学者执行机器学习应用中常使用的资料集.

下图是MNIST database中的一个图像:数字6
https://ithelp.ithome.com.tw/upload/images/20210916/20140792b5ii5oWNy4.png

针对MNIST再提供下列资讯:

  1. 每张MNIST的大小为28x28 pixel
  2. 资料集包含60,000张训练影像档与10,000张测试影像档
  3. 下载资料集之後, 解开压缩档会包含二个目录, 分别是train目录与valid目录, 而且在train目录与valid目录下会有0-9共10个目录, 这10个目录就是做为标签(Label)使用, 因为会将所属的数字图像放在所属的目录中, 例如数字6的图像就会放在目录名称为6的目录

在本范例中, 将会在jupyer notebook下载资料集进行使用, 因此不需要事先下载.

范例一的平台工具说明

在本范例所使用的平台工具会使用到JuypterHub, MLflow与Web Server(Django), 如下图所示:
https://ithelp.ithome.com.tw/upload/images/20210916/20140792rg01d01M90.png

  • Trainging
    • 会自行安装JupyterHub, 目的是用来撰写notebook并执行训练
  • Tracking
    • 会自行安装MLFlow, 目的是用来记录每次训练的parameter、metric与model
  • Serving
    • 会自行安装Web Server(使用Django), 目的是提供endpoint, 让使用者可以存取这个endpoint之後取得推论结果

我们下一篇就来安装JupyterHub

参考资料

http://yann.lecun.com/exdb/mnist/


<<:  从零开始学游戏设计:模型基础 Part.3 雕塑场景

>>:  Episode 1 - 真.即将失传的古老技艺

Day20 :【TypeScript 学起来】是 JavaScript 没有的 Function Overloads(函式超载)

终於20天了,那个心情就是有点开心快结束了,但对後面10篇感到担忧,既期待又怕无法完赛 XDD 好...

DAY26 把这个Google maps 放在 APP 上(二)

看到标题有个(二)该不会又是很长的系列文了吧!? 并不会。 因为有点复杂。微懒。 抓取目前所在位子 ...

[28] 用 python 刷 Leetcode: 1013

原始题目 Given an array of integers arr, return true i...

Day 27:开始撰写 Playbook

今天努力了一个下午,终於算是勉强搞出了一组能动的 playbook,这边就来记录一下过程以及就我所知...

终极密码DC版

撰写大家熟知的终极密码 示意图 开始撰写 # cogs/guess.py @commands.com...