[Day 15] 资料产品生命周期管理-预测模型

尽管都是模型,但预测模型目的在於预测未来,所以开发方式也会和描述型模型有所差异。

Initiation

起始阶段要确认的事情跟之前差不多。

商业意图是否明确:商业意图不是指明确的需求,而是想利用这个预测模型做什麽。例如「想预测使用者会不会点击」,这只能算是需求;「想透过提高使用者点击率提高使用者观看数」这样才是比较完整的商业意图。因为使用者可能会提出无法满足商业意图的需求,这时候做了也是白做,所以最重要的事情就是确认商业意图。

需求:不管预测人数、预测点击、预测营收都是单纯的预测目标。如果商业意图还不明确的话,就还需要在回到上一步多着墨,至少要需要变成一个比较明确方向的问题,才有办法往下走。

资料来源是否足够:这关乎到「能不能回答问题」,那如何判断需求可否被预测?很多人(特别是老板)会觉得模型无所不能,什麽都可以预测。尽管现在预测模型种类繁多,但标准很简单 - 「有标注的资料是否够多?」现在大多数的预测模型都是需要 ground true(亦即标准答案),来做为训练资料,如果一个问题手上有的标注资料不够、或是这个问题根本无法很好的被标注,那就表示这个问题做起来风险很高(或做不出来)。

Design

预测模型在设计上就有很多选择了,最主要就是要区别到底要预测什麽

  • 预测数值
  • 预测类别
    • 双类别
    • 三或三以上个类别

接着就是照一些小细节去选择对应的模型。
https://ithelp.ithome.com.tw/upload/images/20210916/20141140qVmxbGznMh.png
(https://bigdataanalyticsnews.com/machine-learning-with-python-a-revolution-in-the-field-of-data-analytics/)

如果是 Deep Learning 的话,也是根据需求来选择相应的结构,像是

影片/影像辨识:走 CNN 路线
声音/文字辨识:走 LSTM 路线
对抗训练:走 GAN 路线

https://ithelp.ithome.com.tw/upload/images/20210916/20141140GPDpgfwm5C.png
(https://www.techwebspace.com/9-ways-to-become-the-macgyver-of-deep-learning/)

总之细节很多,就有待各位大大来补充。

Implement

在开发预测模型上,步骤就比较复杂。
https://ithelp.ithome.com.tw/upload/images/20210916/20141140yfmevOaoO1.png

在做预测模型时,通常会先使用过去的资料,接着将资料分为 Traning Set(1a) 和 Testing Set(1b)。

接着会使用 Training Set 代入演算法来训练模型(2a)。接着我们会用训练好的模型来做资料验证(有些套件会将Training Dataset 分成 Training Set 和 Evaluation Set(3b)),透过这样的过程来优化演算法的参数。并透过之前分出去的 Testing Set 来验证不同演算法的优劣。

最後我们会选出最好的模型进入正式环境(4,5),并用来预测正式资料。

Deployment

ML 模型部署部分是最近最热门的题目 - MLOps 值得用一整篇来写。


<<:  【第十五天 - Linked list 题目分析】

>>:  < 关於 next.js: 开始打地基| Next中的Pages,究竟有什麽用途? >

Day 01-AWS Solution Architect Associate的铁人之旅行前会

最近好友阿泰邀约参加2021的铁人赛,碰巧我正在准备AWS Certified Solution A...

Angular 深入浅出三十天:表单与测试 Day02 - Template Driven Forms 实作 - 以登入为例

今天要来用 Template Driven Forms 的方式实作一个简单的登入系统,撇开 UI ...

[Day 17] 实作-热门活动排行 List

嗨!昨天做好首页的图片轮播了 可能大家会疑惑 什麽时候才会串接api? 其实我个人习惯是把前端页面都...

Day 16 ATT&CK for ICS - Persistence(1)

攻击者进入 ICS 工控环境之後,会利用许多手法让自己保持跟 ICS 系统与设备的连线状态,让自己可...

[ Day7 ] General Skills 小暖身

今天我们再解 General Skills 2 题好了, 我看到和昨天同样概念的题型耶 一起解完好了...