近年来由於电脑硬体技术的提升使得机器/深度学习(Machine/Deep Learning)技术蓬勃发展,让人工智慧成为了当红炸子鸡,在各式各样的领域都能够看到深度学习的应用达到了与人类水平相当甚至是更理想的成果,像是人脸辨识、自然语言处理、推荐系统、AlphaGo等等。语音相关的领域当然也不会缺席这波深度学习的热潮,Apple 的语音助理 Siri 就是一个常见的例子。
要能够让深度学习的技术应用在语音领域,最重要的一点就是要让电脑能够听得懂人类讲的话,也就是所谓的自动语音辨识(Automation Speech Recognition, ASR),简称语音辨识。当电脑能够听得懂人话之後,我们就会想要进一步的希望电脑也能够理解人类说话时所隐含的情绪,情绪的展现能够让对方更清楚的了解讯息所代表的含义,因此衍生出了另外一个应用领域-语音情绪辨识(Speech Emotion Recognition)。
以现有的各种语音辨识相关技术而言,语音内容若是清楚乾净无杂讯的,电脑辨识的结果几乎能和我们所期望的相符合。但是在现实生活的环境中会有许多干扰语音内容的杂讯、噪音,轻则像是人们之间的交谈声,重如施工工地或是飞机起降时的噪音,这些环境的噪音往往会造成语音辨识的效果变差。
在看完了以上关於深度学习在语音领域的应用简介之後,希望各位能对语音辨识、语音情绪辨识有初步的认识。
接下来的29天,要分享的内容主要包含以下3个部分:
第一天的内容就到这边了,接下来就准备进入语音辨识的世界了!
<<: [Angular] Day13. Built-in directives - attribute
>>: 系统和应用软件提供安全保证- 通用标准(Common Criteria)
今天大概会聊到的范围 LazyColumn StickyHeader 基本的画面可以显示了,但在 ...
Samantha和Theodore在一起的时候,时常提及自己在写钢琴曲,灵感来自於和Theodore...
一、前言 想要进行资料分析,要做的第一件事当然是收集资料,所幸现在是2021,我们不需要为了股票资料...
敝人很常踩到诈骗网站,第一屏就是一个庆祝的小动画, 恭喜我中奖(好想中威力彩啊) 网页也很常有这种奖...
前言 该系列是为了让看过Vue官方文件或学过Vue但是却不知道怎麽下手去重构现在有的网站而去规画的系...