用订便当讲解订定题目的用途 | ML#Day12

我们做一个题目,基本上简单可分成两种用途:

  1. 了解关系
  2. 预测未来

故事例子

假设工作日常之中,我负责帮忙大家订中午的便当,一开始团队有10个人,会订11个便当,因为其中一个人胃口大需要吃两个便当。过了一阵子,团队加了一个人,结果需要订了13个便当。

团队持续再补人,人员共12人,订14个便当。

再後来人员共13人,订15个便当。

这个时候,因为有了一些历史资料,我开始整理共通的特徵,团队大概两周多一个人,到时候就会需要多订一个便当。

目前常订的店家,接单限制大概都在20份以下,换句话说预测12周之後,我手上的店家清单需要换一批,变成都是能够接单20份的店家,因为有这个预测,我能够抓个准备时间,避免到时候因为订不了便当带来的损失成本,这就是做预测带来的价值。

然後有时候团队成员会出现大胃王,需要额外多订个便当,因此假设老板问我团队若有50个人,大概需要订多少便当,大概会给出55个的答案(粗略估计10个人有一个大胃王)。

因此有这个了解关系的认知,每当新夥伴加入的时候,我还会先问他是不是大胃王。

如果有需要餐叙或饮食的活动,活用订便当的认知,分量当然也就不会抓一比一的关系,这就是了解关系能够带来的价值。


准确度问题

就上面例子不考虑资料太少问题,其实很明显的所谓预测没有办法到达百分之百精准,也许资料越多,考虑的面向和处理经验越多,当然预测准确率有可能会提高。不过要思考的是,这个预测能带来的价值,要投入研究和为了提高精准度需要花费的成本,到底值不值得?

了解关系也是同样的道理,到底几个人当中就会出现一个大胃王?同样是捉摸不定的推论,谁也知道那个预估可靠性的天花板只能到某种程度,也同样的资料多或许有帮助,譬如多收集了无数人类的身高体重,身体健康状况和饮食习惯,藉由大量的数据提炼更多的特徵参数,然後加入新的模型训练,以此提高精准度,不过,又是一个成本问题。


两种目的,就有两种做法

上面例子的两个问题,预计两个礼拜会加一个新人,和一个人会需要多订一个便当,低机率会在需要多订一个,是两件不同的事件,当然在ML算是不同问题,资料收集和处理方式不同,训练模型也不同。

也许在我们大脑会直觉认知两者是有关联的处理,虽然是有关联没错,但ML还不是万能的许愿机,必须分化和拆解成简单步骤,它是不同的目的=不同的题目=不同的处理。


简单的模型和题目,只适用单一状况

假设,团队招募到15人之後就不再扩编。

假设,一个月後,公司组织调整,我们与另一个团队合并,一口气马上额外多了20人。

假设,新进的人全部都是大胃口。

啪,一下子模型就没有用了。

所以ML的工作项目,千万要知道可能需要持续调整,不论是环境改变,还是精进模型的精准度,这点在投入之前请务必再三评估用上ML的情境。

通过以上介绍,应该能够更清楚的知道,我们想做的是了解关系,客户的流量数经由训练出来的模型,可以大概预期订单的总金额在哪个范围,藉此判断系统或者客人是否有异常的行为。


<<:  从零开始的8-bit迷宫探险【Level 12】把迷宫涂上喜欢的颜色

>>:  Day14 逻辑斯回归实作

[Day 13] tinyML开发框架(一):TensorFlow Lite Micro初体验(下)

执行推论(C/C++ + Arduino IDE + MCU) 书接上回[Day 12] tinyM...

使用回归分析与其意义 | ML#Day15

选模型并非最重要 为什麽我们要以回归分析的方式来建立模型,其他方式可不可以?其实没有说不行。 然而回...

练习实作的轮回

这次我就沿用上篇的程序码接续练习转xlsx档。恩~所以这篇应该会满短的,主要是看我学习成果。XD 首...

【领域展开 23 式】 Page & Post ,双 P 关系确认

Page & Post 傻傻分不清楚 由於前两天在研究 Menu,发现设定 Menu 的时候...

[Day 9] Leetcode 917. Reverse Only Letters (C++)

前言 今天的daily challenge题目是917. Reverse Only Letters,...