Day 09 : 用於生产的机械学习 - 定义范畴 Scope

在 Day 05 ML 专案生命周期介绍分为 4 个阶段与 7 大主题，第 1 个阶段为「定义范畴 Scoping」，相较其他 3 个阶段，Scoping 较偏管理知识面的讨论，有专案发想经验的您应该不陌生，我们会试着把商业命题转换为 AI 命题。

以下延续吴恩达 Machine Learning Engineering for Production
(MLOps) Specialization 系列课程所提的 ML 专案生命周期架构进行说明。

定义商业命题

一个明确的商业命题可以引领专案往好的方向发展。对参与其中的您而言，专案方案理解越清晰，团队运行及专案发展也越容易成功。
在命题的过程中，要思考的包含:
- 专案的目的是什麽?
- 要如何衡量绩效?
- 需要哪些资源?

专案的目标是什麽? 透过脑力激荡吧!

设想目标有时很单纯(老板说要做)，也有采取一种比较开放的方式，透过「对商业问题脑力激荡」可能有较佳的设想，毕竟 ML 专案需要企业资源投入，在起步阶段，也面临较多的不确定性。
简单的想法是罗列出面临的「问题」，激荡对应的「解决方案」，排列问题的重要性以及时效性。
同时，再进一步聚焦这个问题一定要 AI 解决吗? 如何解决? 「对 AI 解决提案的脑力激荡」，不是所有命题都需要藉由 AI 完成的，开放且审慎的评估适切的目标达成做法，总比头洗下去却方向错误的好。

设定专案目标脑力激荡的过程中，也同时「评估可行性与潜在价值」，好的开始是成功的一半，毋须躁进。
举例一些对於 AI 相关的命题，例如:
- 改进建议系统。
- 改进搜寻结果。
- 改进分类系统。
- 产品定价优化...

要如何衡量绩效、定义里程碑与资源?

一旦作为 ML 专案，绩效衡量可以用不同的指标综合评判(顺便做个仪表板？)
- 基於模型的准确率、loss、RMSE、F1等。
- 系统效能的延迟、计算时间、耗能等。
- 商业成果，如投报率等。
衡量绩效的标准，可以参考:
- 既有服务展现的水准。
- 开源专案展现的水准。
- 基於「人类表现的水准」。非结构性资料(图片、声音、文字)可以用人类表现水准 HLP (Human-level Performance) 来设定目标。 HLP 一词来自吴恩达 deeplearning.ai 提出，在其电子报中讨论基於 HLP 而非追求更高绩效的想法。
- 有限的时间基准。
- 在较不明确的状况下，可以透过标竿学习、概念验证 POC 掌握专案轮廓。
需要哪些资源?
- 启动专案的资源规划，如所需人力、时间、成本、设备等。

AI模型的绩效一定要超过人类水准?

在衡量模型绩效时可能会落入一个迷思，就是AI模型的绩效一定要超过人类水准，但如果分为结构性资料、非结构性资料(图片、声音、文字)衡量绩效，确实结构性资料的绩效可能大於 HLP ，但非结构资料如果连人类都无法判读，又如何检视您的 ML 模型表现是否真的如此优异?
举例来说瑕疵检测、语音辨识，在遇到逼近或略为大於 HLP ，您可以将目光移至有关安全性、偏见、稀有类别的性能。

\	非结构资料	结构资料
新服务	HLP	Benchmark
既有服务	过往服务水准、HLP	过往服务水准、Benchmark

确认没有道德疑虑

企业服务是需要负社会责任的，在进行 ML 专案开头时，应该确认专案有无道德疑虑，是否有潜在的偏见风险。您不会希望辛苦做出来的人脸辨识，却发生像脸书AI将黑人影片误标为灵长类的状况。

小结

本日简要介绍在定义范畴阶段可以的流程及注意的事情，可以透过脑力激荡探询欲定义问题到构思解决方案，进一步厘清是否要发起 AI 专案，衡量绩效的方式与绩效基准，以及需要的资源。
人类的表现 HLP 在声音、影片、文字的辨识能力是很强大的，让您的 ML 能达到 HLP 就有替代人力的机会，或许您可以转移注意力到预测伴随的安全与道德问题。

参考

<<: 电子书阅读器上的浏览器 [Day09] 支援音量键翻页

>>: Day 4:要玩KMM，你需要一台Mac....还有很大很大的容量．

[Day30] Flutter with GetX flutter_WebRTC

杂谈

<重要> 加密货币Token投资警示分享

杂谈

python30天-DAY29-Matplotlib(4)

杂谈

【Day 03】从零开始的 Line Chatbot－建立专案

杂谈

Day 16：AWS是什麽？30天从动漫/影视作品看AWS服务应用 -《云端情人》part 3

杂谈

Day 17 self-attention的实作准备(三) 测试使用keras来建立模型

前言昨天说到要跑范例程序，但是只有做到下载资料集，以及切分资料集，今天来建立模型利用Sequen...

订单清单 - 已完成清单(MVC 的权责分职)

上一篇中，我们已经完成了"未完成清单"的内容。这篇我们接着继续做已完成清单的内...

【第二天 - Stack 介绍】

Q1. Stack 是什麽一种资料结构的概念，假设有一个容器是装马克杯的盒子 (这个盒子下面是封死...

Vue.js 从零开始：MVVM、渐进式框架

本篇会围绕网路上常讲到主题，有些面试题应该也会多少考到一些，至少面试时可以讲的出来。宣告式的渲染 ...

《赖田捕手：番外篇》第 37 天：用 Netlify 布署前端网页 (二)

《赖田捕手：番外篇》第 37 天：用 Netlify 布署前端网页 (二) 虽然他爱着所有的布署方式...