【Day1】准备出发

前言与动机

在提到声音转换的时候,我们第一个会想到的可能就像是柯南那样 (他会把他叔叔麻醉然後用变声器伪装成他的声音),而事实上我们想做的就是同样的事情 (没有麻醉的部分)

然而转换声音这件事情并不是一件很有创意的事,早在 5 年前的时候就有人成功了,甚至在 2018 年的时候有家叫 琴鸟 (Lyrebird) 的公司发表了一部影片,内容是复制了川普的声音

公司的名字会叫做琴鸟的原因是因为这种鸟在自然界会模仿周遭所听到的声音,而且你不觉得叫琴鸟比叫八哥或鹦鹉好听吗?

你可以想像未来就算接到视讯电话,你也不见得能够确定电话另一头就是真正你认识的那个人,AI 的换脸技术加上声音转换技术如果都能够到达 Real - Time 又高品质的水准的话,而这样的未来似乎离我们不远。

换句话说,也就是现在的水平或许还没办法那麽厉害,或是可能有一些限制,像是训练困难等等

接下来的时间大致上会这样安排做分享,还请大家多多指教!

大纲

  • DAY 1 ~ 4 - 声音的基本介绍与前处理,GAN
  • DAY 4 ~ 12 - Vocoder,AUTO-VC Inference In Pytorch
  • DAY 12 ~ 21 - MODEL 介绍与实作 In TensorFlow,也许中间会加入一小部分生成音乐的介绍
  • DAY 21 ~ 30 - TransFormer 的实作分享

备注

一些程序码会一并更新在 我的 GITHUB

/images/emoticon/emoticon09.gif/images/emoticon/emoticon13.gif/images/emoticon/emoticon14.gif/images/emoticon/emoticon22.gif/images/emoticon/emoticon28.gif


<<:  [Day 1] Hack一下,Text文字讯息

>>:  从 IT 技术面细说 Search Console 的 27 组数字 KPI (1) 前言

Day24 axios基本语法(GET、POST请求)?

大家好我是乌木白!今天要和大家讲 axios 基本语法~ 在处理 AJAX 的时候,有一些套件可以...

Day22 [实作] 一对一视讯通话(2): Signaling server

今天我们要实作 Signaling server 的部分: 建立文件 # 进入要放专案的路径 ❯ c...

[ 卡卡 DAY 22 ] - React Native 元件害羞之骨架屏先让你瞧 react-native-skeleton-placeholder

咦 大家有见网友的经验吗? 在还没见面前是否都是以照片来判断这个人是不是自己的菜? 网站也有一个时...

Day31. Rails 搜寻的强大帮手 - Ransack

ransack是一个基於Model层级的Gem,使用Ransack,可以将原本的Sql Statem...

学习使用 Node 和 React 进行全栈开发

网站涵盖了商业网点提供的一系列有益健康的设施和功能。无论是教育、新闻、博客还是电子商务商品,在线门...