Day 17 机器学习

今天我们要介绍的是机器学习,所谓的机器学习是指着重於训练电脑从资料中学习,并根据经验改进且在机器学习中会训练演算法寻找大型资料集的模式和关联性,并根据该分析做出最佳决策和预测,机器学习应用程序会随着使用不断改善,存取的资料越多、准确度越高,而机器学习在生活上的范围也很多,例如:应用於我们的家中、购物车、娱乐媒体,以及医疗保健业等。

机器学习

机器学习的种类大致分为以下几种监督式、非监督式、半监督式或强化式四种学习模式而在每个模式下都可以套用一种或多种的演算法,而机器学习演算法主要用於分类事物、辨识模式、预测结果,并做出周全的判断,在分析复杂的资料时可以使用不同的演算法也可以用不只一种的演算法,以下我们稍微介绍一下四种的学习模式。

监督式学习

所谓的监督式学习是指一对一的比照方式,间单来说就是电脑从标签化的资讯中分析模式後做出预测的学习方式,标记过的资料就像标准答案,电脑在学习的过程透过对比误差,一边修正去达到更精准的预测,这样的方式让监督式学习有准确率高的优点,监督式学习方式需要倚靠大量的事前人工作业,将所有可能的特质标记起来,这过程相当繁复,当范围扩大、资讯量增加,会更难去对资料标记出所有特徵,所以在面对未知领域时,几乎是完全无法运作,举个例子就像我们一些猫狗类的照片分别帮他标记,丢进一张照片时让机器去分析出一个解答,然後将其跟正解对比来看是否有分析错误并加以改进,这样就是我们所谓的监督式学习。

非监督式学习

所谓的非监督式学习是指让机器自行摸索出资料规律,在非监督式学习的训练资料跟监督式学习的不同是在於资料不需要事先以人力处理标签,机器面对资料时,做的处理是依照关联性去归类、找出潜在规则与套路、形成集群,不对资讯有正确或不正确的判别,非监督式学习的特性让它在资料探勘初期是个好用的工具,对比监督式学习来说非监督式学习可以大大减低繁琐的人力工作,找出潜在的规则,但这样的方式,也会造成较多功耗,甚至也可能造成不具重要性的特徵被过度放大,导致结果偏误、无意义的分群结果,比如说我们将多张猫狗的照片丢入,让机器自行摸索,例如可能大只的是狗狗或着说狗狗的尾巴毛比猫咪多,但不给正确的解答,而在丢新的照片时如果有以上的特徵,那机器就会将那张照片归类为狗狗。

半监督式学习

所谓的半监督式学习是指有监督式与非监督式的特质,半监督式学习对少部分资料进行标记,电脑只要透过有标记的资料找出特徵并对其它的资料进行分类,这种方法可以让预测时比较精准,也是目前最常用的一种方式,对於我们来说要取得有标记的资料会比取得没有标记的资料来的困难,就像我们会知道照片是狗是猫但不一定每张照片都会知道他的品种,所以对於我们来说要取得资料简单,但要取得有标记的资料较为困难,而非监督式学习的方法就是我们标记一些少数的资料,然後让机器去学习少数的资料进而让他可以分析没有标记的资料,这样的方式相对於非监督式学习的方式来的准确,因为非监督式有可能将一些错误的特徵归类为正确但也因为都没给正确解答所以会倒致分析的错误,但半监度式学习的方式一开始会有些正确的资料可以做依据跟学习,所以会比非监督式来的好,例如我们将一堆猫狗照片丢进去但将某些猫狗的照片给予标记,让机器可以先学习那些正确照片在去分析没有标记的照片。

强化式学习

所谓的强化式学习是指在未知探索与遵从既有知识间取得平衡,强化式学习的特徵是不需给机器任何的资料,让机器直接从互动中去学习,这是最接近人类原本的学习方式,机器透过环境的正向、负向回馈当中,自我学习并逐步形成对回馈的预期,做出越来越有效率达成目标的行动,这个训练过程的目标是获取最大利益,简单来说运用强化式学习的方式,我们不标注任何资料,但告诉它所采取的哪一步是正确、那一步是错误的,根据反馈的好坏,机器自行逐步修正、最终得到正确的结果,能使非监督式学习达成一定程度的正确性,就不能缺少强化式学习的方式,透过一次一次正确与错误的学习,最後的预测就会越来越精准,例如我们将一些猫狗的照片丢进去,但我们不去告诉机器猫狗有哪些特徵,而是在机器分析出来特徵的时候,我们给予解答,也许是正确也许是错误,但机器就可以在当中学习,而达到说下次再做到这项分析时可以知道这项分析的错误与否,达到在比非监督式学习有更好的准确性。

以上就是简易的机器学习介绍,明天我们将介绍机器学习的方法。


<<:  【程序】洞察专案管理方法 转生成恶役菜鸟工程师避免 Bad End 的 30 件事 - 19

>>:  Day16:卡文一篇,难解

TailwindCSS 从零开始 - 完赛心得

完赛的内心小剧场 心得 感谢坚持到最後的自己,本次铁人赛完赛了,最後一篇就来点软性的心得文吧! 因...

Day30 完赛结语

终於来到最後一天了,经过这30天的练习与磨练,我学习到很多有关网页的基本知识,也谢谢有在观看我文章的...

Day08 - this&Object Prototypes Ch3 Objects - Contents - [[Get]]

Object 本身自带 [[Get]] 机制能帮我们找到符合 property name (或说 k...

下有对策 - CORS

前言 虽然还没实际碰过 CORS 错误,但实在太好奇了,所以到处看了文章,得出两个感想: 查不到解法...

[Day02] 想要维度提升,先为自己铺路

在与团队成员的定期面谈中,一个很常被问到的问题:「可以给我一点职涯发展的建议吗?我要怎麽做,才能成为...