Day4:梯度下降法(Gradient descent)

  梯度下降法经常被使用为优化学习的一种方式,寻找局部最佳解(至於为何是局部,之後会提到),想像有个半圆形的碗,在任何位置放入一颗球,那颗球就会在碗内滚动,每次滚动的高度都会越来越小,直到停在碗底。梯度下降法正是运用这样的方式来计算,求出最佳解。
https://ithelp.ithome.com.tw/upload/images/20210914/20140722k76OjcV7td.png
  在原有的函式(也就是黑色曲线),随机找到一个点,用微分的方式找到与这曲线的切线,目标是要把这切线变成水平线(也就是切线为零),因此发现这切线不为零的时候,接着调整切线的参数,计算曲线与切线相交的点,再慢慢调整直到找到最佳解。
  但要注意切线的调整大小,如果调整幅度太大,可能会无法找到最佳解,一直卡在同一个地方,如下图直接把切线调整为零,则永远无法抵达最佳解。
https://ithelp.ithome.com.tw/upload/images/20210914/20140722yd8SYMyGLY.png
 至於为何只能找到局部最佳解,因为不可能刚好就只有一个凹下去的最佳解,如下图,如果先找到了其中一个局部最佳解,就无法发现有更好的最佳解了,除非用其他资料测试的时候,有发现到原先的解并没有那麽好,才有可能再做调整,因此为什麽机器学习要一直不断的训练,会比一次次更好,有一部份原因正是找到更好的局部最佳解。
https://ithelp.ithome.com.tw/upload/images/20210914/20140722DjiIF0h0vm.png
 另外,梯度下降法,如果刚好在坡度较为平缓,但并非最佳解的地方,也会使机器学习上颇有困难,如下图。
https://ithelp.ithome.com.tw/upload/images/20210914/201407228hhVUEZrUW.png
 虽然梯度下降法仍然有些缺点,但只要透过不断地训练就避免陷入莫名的状况,使得机器越来越好。


<<:  [Day 09] 资料和资料之间的一对多关联

>>:  Day 14. Hashicorp Vault: Backup (Consul)

Day 14— To Do List (1) 专案前置

我们今天要来正式开一个新的专案啦! 不同於以往我们都用 Google Form 来当作载体,这次我们...

资讯安全战略(information security strategy)

-业务连续性政策 高级管理人员通过制定战略计划或战略来实现组织的使命和愿景,并通过政策指导战略的实...

从零开始的8-bit迷宫探险【Level 1】一切都是从红白机开始的

哈罗~ 大家好,我是雪花冰 我是个从小喜欢玩电玩,立志长大要当 GM,却半路入坑程序这条不归路的攻城...

Day4: Network Access Control List(NACL) 简介与布建

上一篇我们提到了Security Group(SG),这一篇我们来讲Network Access C...

[23] 用 python 刷 Leetcode: 290 Word Pattern

因为我对 python 不熟,题目可能会在简单和中等之间跳来跳去 用 Python3 解 LeetC...