00:00
好,我们这次来玩点什么呢?我们先听这么一首歌,这首歌呢,是东方不败风云再起的一个插曲,叫笑红尘,是那个沧海一生笑的那天,红尘渡可笑的声,可笑痴情最无聊。然后我们用这么一个东西呢,就可以把一个呃,音乐里面有人声有背景音的东西分解成两个东西,哎,要不然呢,你要是要这个instrumental only,就是要要BGM啊,但是不要人声,Vocal only呢,就是只要人声,但是不要BGM,然后分分分开之后呢,是这种效果。知道。红尘多可笑,痴情最无聊,对梦中全忘掉,甘天飞得太早,怎么样把陈淑华的纯人声变成这个这个哦O的纯人声呢,是需要用到这样一种东西,叫做深度学习,我们可以看到这块呢,有这么一个这个so its so its,这么一个仓库,然后这个仓库呢,就很活跃很活跃,而且呢,就是有很多的分支,有很多各种各样的贡献者,挺好用的东西,然后我们可以到这个code的with GPU GPU就是显卡去搜这个SOSSO。
01:57
但是他没搜到是吧,So which这块我们搜到一个open喷啊open它它建立了这么一个这么一个镜像,当然还有其他的各种各样的镜像,那么我们其实可以选择一个镜像,哎,那我们选择谁呢?选择这个镜像,选择这个镜。
02:15
选择镜像之后呢,他就告诉我们这个安全声明,然后呢,它呢是有一个仓库地址,这个这个仓库地址其实就是就是这个这个仓库的一个一个版本,其中的一个版本,然后它有一个底膜地址,底膜就是一个基础的模型的地址,然后它就会有这么一个镜像文件,哎,那什么是镜像文件呢?镜像文件就是就是它会装一个类似于Linux的系统,然后把这个相关的环境都装好,然后你就不用去呃设置,比如说你是用GPU啊还是用CPU啊,你的那个拍to是GPU版的还是C这个CPU版的,不用这都给你设置好了,然后呢,我们就可以在ODL。
03:06
就是自动,呃深度学习里面去创建这个容器,然后呢,你需要租用一个就是GPU的机器,就是一个帮助文件,这个帮助文件,那这个呢,就是他的流程,流程的方法,那么呃,他做了一个什么事儿呢?首先他把这个so it这个这个仓库放到了ODL的temp里面,所谓的叹号呢,就是执行,然后是一个外部命令,就是你这些东西都可以在一个终端里去自己做这些东西啊,比如说我们可以LS啊,所以为什么我们要学习vim,学习Python,学习Linux,这都是,这是一个根本环境,这个是个根本环境,然后一路一录下一步,这个就是呃,我们可以看的清楚一点,我呢是下了三个视频文件,这视视频文件呢,就是OE的电路教程,电路教程有一个特点,就是它的那个BGM比音量比较小,不像不像那些音量特别大,所以。
04:06
它相对来说就是比较容易得到人的干声,然后呢,用FFMPG去得到这个纯音频,然后下了一个嗯,Audio audio ser audio就是音频slicer那切片。他就是把音频切片的,因为他有一个要求,他的要求就是就是要把这个音频呢,切的比较小角色的名字,然后把它们都放进来了,放进来之后呢,就放这么一个文件的位置,然后呢,我们就可以对这个数据集进行预处理,预处理然后就就就这么运行这些东西,这么运行这些东西,这个东西就是这个训练过程,当你当你执行这条之后呢,它就会咔一直执行,一一直执行,然后就开始训练,最终呢,你生成了模型之后,就需要推理,然后你要在这儿,哎,我就把这个这个终端呢,就把它停了,停了之后呢,就可以再开一个终端,然后去运行这么一句话,运行这么一句话,就是用拍子三去运行这个。
05:07
这个PY文件,然后呢,我们嗯使用的是这个模型,然后呢,我们使用的是这个配置,然后我们使用的是这个这个名字对吧,然后它的这个原始音频呢,在这儿我要把它这个原始音频呢上传到这个弱。若。弱里面,把这个东西上传到弱里面,然后就根据这个东西和模型,最终生成一个你这个模型的这种,这种唱歌的声音,红尘多克夏雪琴最无聊啊,我看到一些类似的作品,有还原这个马三立大师还有刘宝瑞大师就都挺有意思的,哎,那这次呢,我们就分享到这里,我在这个领域呢,还是一个呃入门入门者刚刚刚刚有一点点了解,有不懂的呢,大家多指教,有什么好玩的呢?也希望大家跟我多分享,哎,然后我也希望大家能有机会去看看这个,我在这个蓝桥上放的这个Python,那Linux和VI之类的教程,好,这次就这样,谢谢大家,再见。
我来说两句