[Day 01] 前言 — 是谁杀了模型?

缘起

不知道大家是否有这样的经验,买了一本标榜手把手教学的书,随书附赠的 GitHub 页面上有与每个章节搭配的 Jupyter Notebook,有些甚至还有 Colab (Yeah! 免费的 GPU),一切感觉是那麽的美好,好像掌握所有知识的关键就在几个 shift+Enter 之间,然後,就没有然後了?

虽然很认真学习了各种最新的演算法、背後的数学原理,甚至从零开始实作并达到很棒的模型表现,觉得自己好像真的开始懂点人工智慧,更精确一点,机器学习了,但当开始工作时才发现,原来老板收到 Jupyter Notebook 是会生气的阿哈哈哈。

而就在我怀疑人生的时候,我接触到了 Full Stack Deep Learning 这个概念,才知道自己太天真了,从 Google 发表於 NeurIPS 的着名论文 Hidden technical debt in Machine learning systems 中的那张着名的图可以看到 (我知道我说了两次着名,因为这张图至少有超过五种不同配色的版本),ML code 在实务上的机器学习系统中所占的部分远小於支持它运作所需的基础架构:
Hidden technical debt in Machine learning systems
也就是说,就算准确度达到 100% 的模型,只要它还孤零零躺在 Jupyter Notebook 里,就像断了腿的千里马,无异於死掉了,而陪伴我们学习成长的 Jupyter Notebook 正是它的棺材。

因此这次铁人赛希望能挑战 MLOps 这个主题,帮助模型起死回生,而我脑子里想的只有一件事,替模型把这条腿接上!

挑战计划

MLOps 的主题很大,有各式各样的技术,也有各式各样的产品可供我们使用,但它们的核心概念却大同小异,就像各种武功都需要有紮实的内功一样,我希望这 30 天能将各种花俏的招数放下,从根本开始学习。
因此决定以 Coursera 课程 Machine Learning Engineering for Production (MLOps) Specialization 提到的机器学习产品生命周期为主轴,分为四大主题并搭配两个实作,架构如下:

  • 部署 (实作)
  • 建立模型
  • 准备资料
  • 计画专案
  • 最终 Project (实作)

过程中会逐步说明每一部分的概念,并在最後实际建立一个小规模的产品放到云端平台上。
希望大家会喜欢,那我们明天见!
/images/emoticon/emoticon48.gif

参考资料


<<:  【LeetCode】当初的 LeetCode 学习

>>:  Day04 - Docker 简单指令操作

Day 25 CSS3 < 2D转换 transform>

转换 (transform)实现元素的位移、旋转、缩放等效果,可以简单理解为变形。 移动 trans...

[Day27]快快乐乐一起打靶机

之後玩完漏洞平台之後,就可以练在玩线上靶机罗~ 这次要推荐的是 Hack the Box:https...

认识 React.js

有了前面 30 天的基础之後,开始学 React 吧~ React 打算写 开发环境 jsx cla...

三十日目:JavaScript XHR 终ノ章 。

おっすー(U 'ᴗ' U)⑅ SONYKO 打油..°♡ 三十日目、各位我成功了 ( 啪叽啪叽   ...

Day 2. Hashicorp Nomad: Upgrade

Hashicorp Nomad: Upgrade 升级方式: 现有主机更新binary档: 通常会建...