资料集格式 | ML#Day13

根据我们要做的题目,获得的结果会是对应的订单总金额,而订单总金额是一个可能范围很大的数值,也就是连续型的资料

数值举例来说,也许101,000,也许120,500,也许是206,239等等,不会有一个精准的数字。

这就确定了我们将使用回归类型的模型,要准备的资料,也是用於回归运算用的资料集

回归(Regression)是属於「监督式学习」的一环,其中一种分类,另一个分类是分类(Classification),再次强调这两者无法混着用。

再进一步细究回归大致在做什麽之前,先要知道一下准备的资料格式。

其实就我们平常的系统开发工作来讲,资料的格式长相并不陌生,有如下图示例:

就像DB存放的一行一行row data一样。

不过有一格一定要放着答案,也就是标签(label)的栏位,其他是放入特徵值(参数)。

有标准答案的问题才能够做监督式学习,换句话说若有标准答案就做监督式学习,或至少你要给它一个预期的答案。

在Google Vertex AI ,这类资料被分类成表格式资料,後续会继续延伸介绍。

收集必要数量的资料并整理好正确的格式,并知道是提供给什麽样的训练方式,就是准备好资料集的概念。

从开篇以来,到目前为止,流程步骤大概如以下这样:

决定好题目 → 确定结果资料型态 → 做成资料集 → 用资料集的资料训练模型

接下来我们简单介绍一下,回归模型的训练方式和原理。


<<:  [Day17] POPCAT in WASM (Part 1)

>>:  Leetcode 挑战 Day 18 [ 367. Valid Perfect Square ]

DAY29 - 切版的学习历程与方向

今天就我自己的经验跟大家分享一下, 培养切版技能的方向~ 第一阶段:练习什麽静态版面都要可以切出来 ...

【Day28】反馈元件 - Modal

元件介绍 Modal 元件为弹出相关元件提供了重要的基础建设,如 Dialog、Popover、Dr...

【企业 WFH 新型态,文件加密护资安】活动分享

跟大家分享一个线上研讨会,有兴趣的可以参考喔~ 居家办公、分流上班等远距办公的企业模式,俨然默默地成...

Day5 - 找出适合自己的案子

当花了很多时间整理经营作品集後,得到主动来信询问真的会非常感动,可以感受到自己是被社会所需要的,在肯...

4.MYSQL语法简介

在SQL中写法很重要,因为写法会影响着最後输出的结果 如果我们要写出自己的资料库就一定要先了解他们的...