根据我们要做的题目,获得的结果会是对应的订单总金额,而订单总金额是一个可能范围很大的数值,也就是连续型的资料
。
数值举例来说,也许101,000,也许120,500,也许是206,239等等,不会有一个精准的数字。
这就确定了我们将使用回归
类型的模型,要准备的资料,也是用於回归运算用的资料集
。
回归(Regression)
是属於「监督式学习」的一环,其中一种分类,另一个分类是分类(Classification)
,再次强调这两者无法混着用。
再进一步细究回归大致在做什麽之前,先要知道一下准备的资料格式。
其实就我们平常的系统开发工作来讲,资料的格式长相并不陌生,有如下图示例:
就像DB存放的一行一行row data一样。
不过有一格一定要放着答案
,也就是标签(label)的栏位,其他是放入特徵值(参数)。
有标准答案的问题才能够做监督式学习,换句话说若有标准答案就做监督式学习,或至少你要给它一个预期的答案。
在Google Vertex AI ,这类资料被分类成表格式资料
,後续会继续延伸介绍。
收集必要数量的资料并整理好正确的格式,并知道是提供给什麽样的训练方式,就是准备好资料集
的概念。
从开篇以来,到目前为止,流程步骤大概如以下这样:
决定好题目 → 确定结果资料型态 → 做成资料集 → 用资料集的资料训练模型
接下来我们简单介绍一下,回归模型的训练方式和原理。
<<: [Day17] POPCAT in WASM (Part 1)
>>: Leetcode 挑战 Day 18 [ 367. Valid Perfect Square ]
今天就我自己的经验跟大家分享一下, 培养切版技能的方向~ 第一阶段:练习什麽静态版面都要可以切出来 ...
元件介绍 Modal 元件为弹出相关元件提供了重要的基础建设,如 Dialog、Popover、Dr...
跟大家分享一个线上研讨会,有兴趣的可以参考喔~ 居家办公、分流上班等远距办公的企业模式,俨然默默地成...
当花了很多时间整理经营作品集後,得到主动来信询问真的会非常感动,可以感受到自己是被社会所需要的,在肯...
在SQL中写法很重要,因为写法会影响着最後输出的结果 如果我们要写出自己的资料库就一定要先了解他们的...