最近,B-Box界来了一位新玩家。它不是人类,而是AI。
和人类玩家不同,只要你不打断AI B-Boxer Vid,它就永远不会累。而且它还有一个特殊技能:可以用任何声音合成B-Box。
也就是说,你任意输入几个声音——可能是随口发出的拟声词,也可能只是敲了下桌子,它都会自动处理成B-Box风的演奏。
无论输入的原始声音如何,最后的结果听起来总是像模像样的——
在上面这段视频中,主人公拍了拍自己的脸颊,还弹了弹一个塑料瓶。这些声音都被电脑的麦克风记录下来,然后输入至模型生成演奏。
从今以后,你也可以称自己是B-Boxer了,谁让Vid的简化版现在已经开放,可以自己动手录制自己的B-Box了。
德井直生(Nao Tokui)是Vid的创作人,也是九州大学的客座副教授及AI音乐创作初创公司Qosmo的CEO。
德井直生团队开发的这个Neural Beatboxer神经网络系统,只需收集一段20秒的音频,就可以定制出配套的鼓声包,之后自动将输入的声音与鼓声有节奏地排序,一个不会重样的B-Box演奏就出来了。
这项技术中用到了两种模型:先是卷积神经网络模型根据输入声音的声谱图,将里面不同音色分离出来。随后,循环神经网络模型生成创作做,这个模型是在谷歌Magenta预训练模型DrumsRNN改进后得到的。
当谈到自己的技术时,德井直生表示还是以新奇好玩为主。
“从技术上讲,这个项目并不是全新的,并且系统的输出听起来永远不会像巴赫或甲壳虫乐队那样好,”德井直生在接受采访时说,“我的目的是为人类作曲家创作有趣、怪异、新奇的节奏,而这些可能是他们不容易想到的。”
想合成你自己的B-Box,可以前往这个地址简单一试(温馨提示:需要用Chrome浏览器打开):
https://codepen.io/teropa/pen/JLjXGK
自己动手,丰衣足食~