用订便当讲解订定题目的用途 | ML#Day12

我们做一个题目，基本上简单可分成两种用途：

了解关系
预测未来

故事例子

假设工作日常之中，我负责帮忙大家订中午的便当，一开始团队有10个人，会订11个便当，因为其中一个人胃口大需要吃两个便当。过了一阵子，团队加了一个人，结果需要订了13个便当。

团队持续再补人，人员共12人，订14个便当。

再後来人员共13人，订15个便当。

这个时候，因为有了一些历史资料，我开始整理共通的特徵，团队大概两周多一个人，到时候就会需要多订一个便当。

目前常订的店家，接单限制大概都在20份以下，换句话说预测12周之後，我手上的店家清单需要换一批，变成都是能够接单20份的店家，因为有这个预测，我能够抓个准备时间，避免到时候因为订不了便当带来的损失成本，这就是做预测带来的价值。

然後有时候团队成员会出现大胃王，需要额外多订个便当，因此假设老板问我团队若有50个人，大概需要订多少便当，大概会给出55个的答案(粗略估计10个人有一个大胃王)。

因此有这个了解关系的认知，每当新夥伴加入的时候，我还会先问他是不是大胃王。

如果有需要餐叙或饮食的活动，活用订便当的认知，分量当然也就不会抓一比一的关系，这就是了解关系能够带来的价值。

准确度问题

就上面例子不考虑资料太少问题，其实很明显的所谓预测没有办法到达百分之百精准，也许资料越多，考虑的面向和处理经验越多，当然预测准确率有可能会提高。不过要思考的是，这个预测能带来的价值，要投入研究和为了提高精准度需要花费的成本，到底值不值得？

了解关系也是同样的道理，到底几个人当中就会出现一个大胃王？同样是捉摸不定的推论，谁也知道那个预估可靠性的天花板只能到某种程度，也同样的资料多或许有帮助，譬如多收集了无数人类的身高体重，身体健康状况和饮食习惯，藉由大量的数据提炼更多的特徵参数，然後加入新的模型训练，以此提高精准度，不过，又是一个成本问题。

两种目的，就有两种做法

上面例子的两个问题，预计两个礼拜会加一个新人，和一个人会需要多订一个便当，低机率会在需要多订一个，是两件不同的事件，当然在ML算是不同问题，资料收集和处理方式不同，训练模型也不同。

也许在我们大脑会直觉认知两者是有关联的处理，虽然是有关联没错，但ML还不是万能的许愿机，必须分化和拆解成简单步骤，它是不同的目的=不同的题目=不同的处理。

简单的模型和题目，只适用单一状况

假设，团队招募到15人之後就不再扩编。

假设，一个月後，公司组织调整，我们与另一个团队合并，一口气马上额外多了20人。

假设，新进的人全部都是大胃口。

啪，一下子模型就没有用了。

所以ML的工作项目，千万要知道可能需要持续调整，不论是环境改变，还是精进模型的精准度，这点在投入之前请务必再三评估用上ML的情境。

通过以上介绍，应该能够更清楚的知道，我们想做的是了解关系，客户的流量数经由训练出来的模型，可以大概预期订单的总金额在哪个范围，藉此判断系统或者客人是否有异常的行为。

<<: 从零开始的8-bit迷宫探险【Level 12】把迷宫涂上喜欢的颜色

>>: Day14 逻辑斯回归实作

用订便当讲解订定题目的用途 | ML#Day12

故事例子

准确度问题

两种目的，就有两种做法

简单的模型和题目，只适用单一状况

Re: 新手让网页 act 起来: Day06 - PropTypes

开源网路钓鱼框架-Gophish(中)

DAY15 模型预测评估方法

[Day29] 立即函式 IIFE

【第4天】资料前处理-图档分类与裁切

[Day 13] tinyML开发框架(一)：TensorFlow Lite Micro初体验(下)

使用回归分析与其意义 | ML#Day15

练习实作的轮回

【领域展开 23 式】 Page & Post ，双 P 关系确认

[Day 9] Leetcode 917. Reverse Only Letters (C++)