Day 16 - 谈谈Data Science Cycle

https://ithelp.ithome.com.tw/upload/images/20210928/20112421XLetF8Csbx.png
图片来源

这篇继续来推荐Corporate Finance Institute (CFI)上的另一门很棒的免费Prep Course -  Data Science Fundamentals (资料科学基础), 它的内容比AI-900还要更深入在说明一些数据预测相关的演算法细节, 比起Azure课程直接用了 AutoML就带过了演算法的部分, 这个课程可以补足一些演算法的基础知识, 此外课程中也补充了例如Ensemble Model的方法, 用多个AI演算法计算之後投票决定最後结果, 可改善单一演算法的误判, 以及除了传统上只拆分Training Data与Testing Data的模式, 说明了也可以再分出一部分Validation Data的其他做法 ; 其他在Evaluation章节中, 也补充说明了Underfitting与Overfitting的所造成的一些偏差与方差之权衡(Bias-Variance Tradeoff), 大大地补充了AI-900课程内容之外, 其他应该是在正统大学课程中讲授机器学习与AI相关课程中会介绍的内容, 对於快速学习相关技术语言与资料科学家沟通讨论上很有帮助 (自己的实务心得!!)

回过来谈一下附图的这个Data Science Cycle, 一大堆的Feedback Loop真的是要实际走过一次实际的案例後才能有深刻的感觉, 而且你可以发现很多的Loop都是回到最一开始的Business Understanding (Identify Project Objectives)也就是"定义问题", 因为一开始的目标明不明确? 太理想? 还是太模糊? 都影响了後续Data所需要提供的类型, 内容, 以及资料科学家用来建立AI Model的作法, 所以其实一开始就要把AI的应用问题定义清楚, 对於AI专案的成功与否, 其实影响力远比後续的其他流程还要重要, Evalutaion(评估)的部分不用说, 以最终使用者(客户)能否实际使用就立判高下, 但Deployment(部署)则又有很多细节在里面, 毕竟AI只是工具, 除了运算资源是在地端还是云端的考量之外, 还可能要考虑与其他系统的串接, 将AI预测的结果汇入既有运作流程的下一步, 只能说这些大的Loop已经面临很多情况了, 更不用提在各别实作流程中, 若是采用敏捷式开发的方式, 有多少的Iteration(迭代)在每周(或每两周)的过程中了!!  只能说学海无涯, 除了实务经验持续累积之外, 也还是得继续深耕!

突然有感於今日是2021年的928教师节, 能常常分享这麽多学习心得, 其实也有赖於当今多到数不清的线上课程与学习资源, 可以持续地终生学习~~~ 谢谢我所有曾经向您学习请教过的老师们, 教师节快乐!!

/images/emoticon/emoticon41.gif


<<:  Day 14. Zabbix 环境规划

>>:  [从0到1] C#小乳牛 练成基础程序逻辑 Day 13 - if 条件判断

Day17 - 帮蛇多加了暂停与继续

class Game{ startGame () { this.snake = new Snake(...

最後的资料库练习~

这篇就继续沿用上一篇程序码吧!那这边就丢完整程序码给各位参考。 接着是资料库表格的建置 当一个资料输...

从 IT 技术面细说 Search Console 的 27 组数字 KPI (2.5) :平均排名的图解

在这系列文的第二篇有提到,SEO 做得越好,平均排名是下降的,很多人都很惊讶,所以我就文章稍作解释:...

[DAY19] 用 Azure Machine Learning SDK 建立 Datastore

DAY19 用 Azure Machine Learning SDK 建立 Datastore 我们...

第25天~还是Firebase

还是Firebase SQLite将PostgreSQL作为参考平台。 开始改java档 从宣告变数...