Day 24: 人工智慧在音乐领域的应用 (AI作曲- RNN作曲)

送你娘盐巴~
[新闻] TVBS主管爆骂下属「x你娘x巴」

(来源)

先不管刚刚你脑海里第一个浮现的答案是什麽，我们真正有兴趣的是，要如何把人类这种经由长时间累积後预测文字的能力教给AI。而最单纯直观的方法就是把文字分段当作 输入资料(Input Data) 喂给RNN，接着告诉RNN这段文字後面应该要接着什麽样的内容，例如:
四季春茶无糖少 (输入资料) -> 冰 (告诉神经网路应该要预测出来的字)
黑糖珍奶半糖去 (输入资料) -> 冰 (告诉神经网路应该要预测出来的字)
大奶微 (输入资料) -> 微 (告诉神经网路应该要预测出来的字)
(梗)
QQㄋㄟㄋㄟ好喝到咩噗 (输入资料) -> 茶 (告诉神经网路应该要预测出来的字)
(梗)

藉由不断的重复类似的训练方式，让神经网路能够学习到看到前面的文字叙述後，能够精准的预测接下来的文字。
那麽套用到作曲上，我们利用一样的原理，把音乐里面的音符当成文字段落。
例如我们利用以下这段旋律

我们先把前面几个音当作输入资料，再告诉神经网路下一个音
=>
=>
=>

经过这样大量的训练之後，RNN就能够在接收到一串音符之後，预估下一个音符是什麽，重复这个过程就能够实现RNN作曲。
如果对於之前介绍过的马可夫模型作曲还有印象的话，会感觉这两个方法其实满类似的，但差别就在於马可夫模型只针对当前的音符去预估下一个音符，而没有办法参考更前面的资料来做参考。举前面文字训练的例子来说，当告诉训练过後的马可夫模型四季春茶微糖少X的时候，他可能会回答你四季春茶微糖少女......

利用RNN以及大量的音乐片段来作曲虽然直观，然後里面也有个非常明显的缺点，就是RNN缺乏长期的记忆性，这边所提到的记忆性又跟马可夫模型里没有记忆性不太一样，以程度上来说，马可夫模型是完全没有任何记忆性；而RNN则是缺乏长期的记忆性，我们用语言阅读来举例，今天如果有以下文字:
"蚵仔面线是台湾有名的小吃，真希望可以找到一碗20元的_ _ _ _"

根据前述的内容，RNN应该可以轻易地回答出正确答案: 蚵仔面线。

但如果今天我们的内容拉长如下:
"蚵仔面线是台湾有名的小吃，但是我们还有盐酥鸡臭豆腐大肠包小肠米粉贡丸珍珠奶茶炸鸡腿烤鸡腿油葱鸡腿烧肉粽蚵仔煎豆浆豆花，
不过还是希望可以找到一碗20元的_ _ _ _"

在这样的情况下，由於RNN并无法拥有长期记忆的关系，导致前面的讯息已然遗失而无法回答出蚵仔面线的正确答案。同样的在利用RNN来作曲时，由於缺乏长期记忆，RNN无法理解音乐的结构与曲式，导致创作出来的音乐比较凌乱，而听起来也会相对的杂乱无章。
为了能够解决长期记忆的问题，另一种改良过後的神经网路:
长短期记忆网路(Long Short Term Memory Network, LSTM) 因此诞生，我们明天再来一起了解LSTM是怎麽解决马可夫与RNN都无法处理的长期记忆问题。

<<: 【Day24】人力资源篇-Time Off

>>: # Day24--开分支免费啦！超简易开分支的方法

Day 24: 人工智慧在音乐领域的应用 (AI作曲- RNN作曲)

循环神经网路（Recurrent neural network, RNN）

2021-Day6. 铁人赛团体组，Line 群组每日催稿讯息实作教学（二）：Send Push Messaging API

爬虫crawler -- 虾皮购物

为了转生而点技能-JavaScript，day24(函式的return观念厘清

[Day06] JavaScript - Hoisting 提升

Day14 Let's ODOO: Security(3) Record rules

Day16:【TypeScript 学起来】新增任意属性的好方法：Index Signatures 索引签名

D0 前言

[DAY15]跟 Vue.js 认识的30天 - Vue 动态模组(Dynamic Components)

EP13 - [TDD] 使用工厂模式让测试更简单

26 - MarkdownLint - Lint Markdown 文件