了解必要的概论 | ML#Day2

ML 最主要的目的是得到一个数学函式,或者是说数学模型,然後运用该模型来得到想要的结果。

所谓模型,以资讯工程的角度简单解释,可以像是MD5或者sha1 那样的东西。


如上图示意,1 个input 对应到1个output,前後关系容易理解,如果有心想研究,进一步讨论md5或sha1里面的计算过程,耐心研读也是还在人类看得懂的范畴当中。

ML想要得到的数学模型,实务上要能够应用并且解决问题,需要更多的参数input,以及可能比md5的运算规则更复杂的运算方式去处理,才有机会得到想要的答案。

然而进入到ML的第一个门槛,自己主观认为首先最大的困难,是「接受」并且「认知」到模型的内在运作方式,大部分时候我们无法理解。

训练出来的模型,其实都是各式各样的数学函式组合,得出来很丑很诡异,基本上无法理解、无法解释为什麽要那样运算,但经过验证後,以统计的科学证明,却会是有用的东西,产生出来的答案可以非常接近我们预期的数值或结果。

无法理解,但有用,理性上要接受它这样,可能就是一道心理门槛。

这个时候我喜欢拿72法则来举例,72法则是爱因斯坦归纳出来的一种简单方式,估计资产翻倍所需报酬率的时间。

利用72法则得出来的结果并不会非常精确,但是已经符合我们的需求,另一个好处是计算成本也相对低廉,譬如说报酬率是8%,72/8 = 9,我们马上就知道需要约9年的时间,资产就会翻倍。

如果要求非常精准,往往要求的算法也跟着相对复杂,计算成本会跟着相对高昂,试想为了得到一个预测结果,将参数喂到电脑运算,可能需要好几个小时或好几天,甚至需要超级电脑才有可能得到答案,谁想要这麽做呢?实务上必定不符所需。

精准程度与否,在人类社会上视其目的,其实大多只需要到某种程度的评估结果即可,譬如说圆周率可是无穷循环小数,我们实务上通常只需要抓3.14,或者3.1415,根本不需要到一个完美的标准答案。

所以若能够找到一个像72法则那样的模型,有效地帮助我们快速简易的评估出一个符合所需的答案,就是ML的最大价值,尤其是现实社会问题往往没有一个标准答案,原本没有标准答案的问题,科学就很难推演,但今天只是需要有方向、有用、有大概范围的答案,寻找问题的解答模型相对就比较容易,成本也能够下降到一个我们更容易接受的程度。

总结来说,ML就是想要找到一个能够解决我们问题的圣杯公式,或许不会懂得圣杯的运作原理,但有用,而这个圣杯公式(数学模型)也只能适用单一问题,如果情况改变就派不上用场。

所以说,团队是否投入发展ML,是需要审慎衡量一下团队的目的与条件。


<<:  Day.2 什麽是时间、空间复杂度?

>>:  个人背景

CI/CD:使用Jenkins(Docker image)自动部署+bitbucket

流程 开发本机将新的commit push到bitbucket bitbucket的指定专案变动,透...

[Day10] 设定 Actions On Google 专案

接续昨日的对话流设计, 现在我们要进入实作的部分让各位能更了解设计流程。 首先从设定 Action...

Trouble with Distributed Systems (4-1) - Truth and Lies

前几天讲了跟分散式系统有关的网路不可靠、时钟不可靠的鬼故事,不可靠的东西这麽多,我们要如何判断真与假...

【Day9】 Speaker Identification 介绍与 D_VECTOR 实做

旧时代的 Speaker Identification 同一人讲不同话,再转成 Mel 之後还是不同...

[Day28]Laravel Eloquent ORM

首先,让我们创建一个 Eloquent 模型。模型通常位於app目录中,但您可以将它们随意放置在可以...