接下来会以李宏毅老师在影片中讲的例子来做说明整理。
寻找一个输入为youtube後台资讯,输出为该频道隔天总点阅率的函式。
初步猜测函数的数学式为
: 今天频道预测的总观看人数
: 昨天频道总观看人数(已知)
: 未知参数
Model:
Feature:
Weight:
Bias:
假设 ,并将训练资料的点阅人数带入Model中,得出隔天预测的点阅人数 ,并与隔天实际点阅人数 相减得出, 为估测值与真实值的差距,再将所有误差加总,得到损失函数 , 越大,代表这组参数 越不好,反之则越好。
假设只有 这个参数,代不同的 进去会得到不同的Loss,产生图中曲线(error surface)。
随机选取初始点
计算参数对Loss的微分,即为切线斜率
斜率为负:增加 的值
斜率为正:减少 的值
参数调整范围大小取决於
超参数(hyperparameters):需自行设定、调整。
反覆进行前面的操作,即会找到解
需要注意的是梯度下降法有时会没有办法找到全域最佳解(global minima),可能会找到区域最佳解(local minima),根据初始点的不同有机率会找到不同的解。
重新回到考虑两个参数的情况,跟上述一样会先随机选取初始点,再个别对Loss进行微分,并更新参数。
<<: Day02 - this&Object Prototypes Ch3 Objects - Contents - Array
深度优先搜寻(depth-first search, DFS)是一种搜寻整张图所有节点的演算法。它的...
何谓布局?布局就是版面配置,而就如同制作公告栏一样,有着不同的排版方式。 接下来我会对LinearL...
前言 今天说好要来介绍 Navbar, 就是导览列,所以也是前端经常使用到的 Component。 ...
台北,又变了呢,记得很久前,才在盖的101到现在,烟火都不知道放了几遍,他一定没有在看那些,如果有机...
在上一篇中介绍了如何透过 router 传递参数,也介绍了怎麽建立嵌套的 route 等等,在本篇中...