Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Google:我能把文本变成音乐,但这个 AI 模型不能对外发布!

Google:我能把文本变成音乐,但这个 AI 模型不能对外发布!

作者头像
AI算法与图像处理
发布于 2023-02-28 03:02:42
发布于 2023-02-28 03:02:42
6530
举报

整理 | 屠敏

出品 | CSDN(ID:CSDNnews)

人工智能的春天已至,未来属于 AIGC。继业界出现 ChatGPTStable Diffusion 2.0、VALL-E 等聊天、图像、文本生成声音等模型之后,Google 最新带来了一种新的人工智能系统,让 AI 发力音乐圈,该系统可以在给定文本描述的情况下自动生成任何类型的音乐,为此,Google 还取了一个言简意赅的名字——MusicLM。

不过,值得注意的是,因为担心该系统存在一些潜在风险,Google 当前虽然已经研发了该系统,但暂时还没有对外公开发布它的计划。

MusicLM 的神奇之处

只闻其声不见其人,也为 MusicLM 带来了一些神秘感。不过,近日,Google 发布了一篇《MusicLM: Generating Music From Text》学术论文,揭开了 MusicLM 的面纱。

据论文介绍,MusicLM 是一个从文本描述中生成高保真音乐的模型,它将有条件的音乐生成过程描述为一个层次化的序列到序列的建模任务,其生成的音乐频率为 24kHz,在几分钟内保持一致。

层次化的序列到序列的建模任务

在业界,MusicLM 并不是第一个 AI 音乐生成器,也正如外媒 TechCrunch 指出的那样,此前 Google 推出的 AudioML 和 OpenAI 的 Jukebox 等项目都已经实现了音乐生成功能,那么,MusicLM 到底特别在哪里?

其实,MusicLM 的与众不同主要体现在以下几点:

一、MusicLM 的训练数据无可比拟

上述提到的几种模型往往由于技术限制和有限的训练数据,无法制作出作曲特别复杂或高保真度的歌曲。

相比之下,MusicLM 是在 280,000 小时的音乐数据集上进行了训练而成,由此可以帮助模型本身创造出令人称奇的多样性、深度的音乐。

二、MusicLM 可以直接根据文本提示生成长达几分钟的音乐片段

只要提供一段描述,MusicLM 模型可以文本自动生成符合场景的音乐,譬如提供的描述如下:

雷鬼舞曲和电子舞曲的融合,具有太空般的、另一个世界的声音。诱发在太空中迷失的体验,音乐将被设计为唤起一种奇迹和敬畏感,同时又是可舞蹈的。

自动生成的音乐如下:

三、MusicLM 模型还可以基于已有的旋律转换为其他乐器,甚至模拟人声

除了以上,Google 研究人员表明,MusicLM 还可以建立在现有的旋律之上,即无论是哼唱、演唱、吹口哨还是在乐器上,MusicLM 都可以继续创建音乐。

与此同时,根据官方提供的示例显示,MusicLM 模型能够按顺序编写多个描述(例如“冥想时间”,“醒来时间”,“跑步时间”,“100% 给予时间”),并创建一种以“故事”或长达几分钟的叙事为背景的旋律,这种非常适合电影配乐。

譬如,想要一个以下叙事内容的背景音乐:

电子游戏中播放的歌曲 (0:00-0:15)

在河边播放的冥想歌曲(0:15-0:30)

火 (0:30-0:45)

烟花 (0:45-0:60)

MusicLM 在理解了文本内容之后,生成的旋律如下所示:

MusicLM 也能通过图片和文本描述的组合进行指导,或生成由特定类型的乐器“播放”的音频。甚至可以设置 AI “音乐家”的经验水平,系统可以创作受地点、时代或要求启发的音乐(例如锻炼的励志音乐)等等。

基于以上,很多网友在了解论文以及通过示例观摩之后,给予了高度评价:

哇,这对我来说比 ChatGPT 还有吸引力。

我会说,谷歌几乎解决了音乐生成问题。

Google 研究员表示,「实验表明,MusicLM 在音频质量和对文本描述的遵守方面都优于以前的系统。」

MusicLM 的不足

不容忽视的是,MusicLM 还有一个强大之处就是可以模拟人声。

不过,MusicLM 当前还并不是一个成熟的模型,就以模拟人声为例,虽然它可以正确处理声音的音调,但是质感还存在一个问题。此外,很多自动生成的“歌词”有些含糊不清,也许有点像某人在哼歌,也许好像在听英文歌,但实际上或许并非如此,听众甚至会一度怀疑自己的耳朵听到的究竟是什么。

Google 的担忧

整体而言,这些由 AI 生成的歌曲听起来像是人类艺术家可能创作出来的,普通听众往往难以分辨到底是 AI 创作还是人类创作。

或也正是基于这一方面的考虑,Google 在开发这款模型之际也犹豫了,在论文中,其表示,“我们目前没有发布该模型的计划”。

具体原因和此前面对 ChatGPT 强大的竞争压力时,Google 谨慎的态度一样,其担心像 MusicLM 这样的模型将会带来许多道德挑战,包括将训练数据中的受版权保护的材料合并到生成的歌曲中。

在一项实验中,Google 研究人员发现系统生成的音乐中约有 1% 是直接从其训练的歌曲中复制的,这个阈值显然足以阻止他们以当前状态发布 MusicLM 这款模型。

“我们承认与用例相关的创意内容可能有会被盗用的风险,”该论文的共同作者写道,“我们强烈强调,未来需要开展更多工作,以应对与音乐创作相关的这些风险。

不过,Google 也表示,它正在公开发布一个包含 5500 个音乐文本组成的数据集 MusicCaps,其中有人类专家顾问提供丰富的文本描述,有助于训练和评估其他音乐 AI。也许在不久的将来,待 Google 摸出合适的道路,我们可以真正地一见 MusicLM 的风采。

关于 MusicLM 的更多详情可见:https://google-research.github.io/seanet/musiclm/examples/

参考链接:

https://techcrunch.com/2023/01/27/google-created-an-ai-that-can-generate-music-from-text-descriptions-but-wont-release-it/

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-01-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI算法与图像处理 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
MusicLM来了!谷歌出手解决文本生成音乐问题,却因copy风险不敢公开发布
机器之心报道 编辑:蛋酱、陈萍 谷歌用 280000 小时的音乐数据集训练出了 MusicLM,却不愿冒着法律风险发布它。 谷歌继续向音乐领域发起挑战!近日,谷歌发布的 MusicLM 模型简直是生成音乐界的小能手,会的乐曲五花八门,你能想到的,它都会满足。 MusicLM 不是第一个生成歌曲的 AI 系统。其他更早的尝试包括 Riffusion,这是一种通过可视化来创作音乐的 AI,以及 Dance Diffusion,谷歌自己也发布过 AudioML,OpenAI 则推出过 Jukebox。 虽然生成音
机器之心
2023/03/29
3860
MusicLM来了!谷歌出手解决文本生成音乐问题,却因copy风险不敢公开发布
谷歌AI练习生写了首歌,网友听完心率都低了
杨净 衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 一段话整出一首歌,甚至是男女唱(跳)rap的那种。 谷歌最新模型MusicLM一经推出就惊艳四座,不少网友惊呼:这是迄今听到最好的谱曲。 它可以根据文本生成任何类型的音乐,不管是根据时间、地点、年代等各种因素来调节,还是给故事情节、世界名画配乐、生成人声rap口哨,通通不在话下。 比如这幅《呐喊》(Scream) 在一段摘自百科的说明提示下,它生成了这样一段音乐。 (蒙克在一次幻觉经历中感受到并听到了整个自然界的尖叫声,它的灵感来源于此,描绘了
量子位
2023/02/28
3790
谷歌AI练习生写了首歌,网友听完心率都低了
国内首款AI音乐大模型一曲封神!核心技术业内首公开,爆改霉霉周杰伦效果惊艳
这不,就在上周,国内首款AI音乐生成大模型「天工SkyMusic」也正式开启内测了!
新智元
2024/04/12
2820
国内首款AI音乐大模型一曲封神!核心技术业内首公开,爆改霉霉周杰伦效果惊艳
Meta开源文本生成音乐大模型,我们用《七里香》歌词试了下
在进入正文前,我们先听两段 MusicGen 生成的音乐。我们输入文本描述「a man walks in the rain, come accross a beautiful girl, and they dance happily」
机器之心
2023/08/07
5980
Meta开源文本生成音乐大模型,我们用《七里香》歌词试了下
音乐界迎来自己的DeepSeek!全球首个音乐推理大模型Mureka O1上线,超越Suno
3 月 26 日,国内「All in AGI 与 AIGC」的科技公司 —— 昆仑万维,发布了最新音乐大模型 Mureka V6 和 O1,给全球音乐圈带来了不小的震撼。
机器之心
2025/03/27
2400
音乐界迎来自己的DeepSeek!全球首个音乐推理大模型Mureka O1上线,超越Suno
配乐行业危,谷歌出手解决音乐伴奏问题,人均音乐人不远了
机器之心报道 编辑:袁铭怿、陈萍 唱歌配什么音乐?这次 AI 说了算。 谷歌继续向生成音频领域发起挑战! 不同于前几天自家研发的文本生成音乐模型 MusicLM,可以生成各种音乐,这次他们最新发布的 SingSong(两项研究仅隔了四天),是一个可以生成器乐来伴奏输入人声的系统,可为音乐家和非音乐家提供一种新方式来创作以他们自己的声音为特色的音乐。 论文地址:https://arxiv.org/pdf/2301.12662.pdf 论文主页:https://storage.googleapis.com/s
机器之心
2023/02/23
3190
配乐行业危,谷歌出手解决音乐伴奏问题,人均音乐人不远了
这AI绝对偷了格莱美奖杯!直接把LLaMA喂成乐坛顶流:开源版Suno来了!
还有这首 AI 新编版《世界赠与我的》!模仿王菲空灵仙嗓也太到位了吧,完全不一样的旋律,一样的嘎嘎好听,宁静中带一点哀伤的意境拿捏得简直了!
机器之心
2025/03/28
1280
这AI绝对偷了格莱美奖杯!直接把LLaMA喂成乐坛顶流:开源版Suno来了!
秒变莫扎特、贝多芬,Facebook提出完美转换音乐风格的神经网络
---- 新智元编译 来源:thenextweb.com 翻译:肖琴 【新智元导读】Facebook人工智能实验室(FAIR)的研究人员近日发布了一个能够将音乐从一种风格、流派或乐器转换成另一种的神经网络,其表现非常优异,所创作的音乐足以骗过人类。这是第一个利用神经网络,用无监督学习的方法重建高保真音乐的AI。 论文地址: https://arxiv.org/pdf/1805.07848.pdf Facebook人工智能实验室(FAIR)的研究人员近日发布了一个能够将音乐从一种风格、流派或乐器转换成
新智元
2018/05/28
6590
用户暴涨近300万,国产AI音乐神器Mureka重磅升级V7,我们拿它复刻了「印度神曲」
目前,该歌曲拿下了 15 万小红心。本想看看是哪位大神的作品,没想到底下一水的评论:这是 AI 生成的!
机器之心
2025/07/24
2130
用户暴涨近300万,国产AI音乐神器Mureka重磅升级V7,我们拿它复刻了「印度神曲」
金山软件北京办公区开工;华为公开全新立体投影专利;小鹏吉利汽车智能化升级丨每日大事件
近日,XR交互方案提供商南京耀宇视芯科技有限公司(以下简称耀宇视芯)宣布完成数千万人民币天使轮融资,由创享投资和星纳赫资本联合领投,上市公司汇通达和华睿资本跟投,原股东咏圣资本和拉尔夫追加投资。耀宇视芯表示,本轮融资主要用于交互算法和芯片的研发投入、产品矩阵布局、市场拓展以及团队扩充,这是其在成立后一年内完成的第二笔融资。
数据猿
2023/03/03
3730
金山软件北京办公区开工;华为公开全新立体投影专利;小鹏吉利汽车智能化升级丨每日大事件
强大的AI网站推荐(第五集)—— Suno
先来欣赏一下我用它创作的歌曲吧,这可是我仅用 2 分钟就完成的,是不是感觉非常不错呢?
LucianaiB
2025/04/17
3670
强大的AI网站推荐(第五集)—— Suno
高质量AI歌曲生成器ACE-Step一键启动整合包,AI自动谱曲自动演唱
本次分享一款AI歌曲创作利器:ACE-Step,ACE-Step是刚发布不久的AI自动谱曲AI自动演唱软件,软件在歌曲生成速度、音乐连贯性和可控性上相对同类软件有了较大提升。ACE-Step在3小时前刚发布了新版本,我基于当前最新版本制作了免安装一键启动整合包。
用户11671502
2025/05/27
3640
高质量AI歌曲生成器ACE-Step一键启动整合包,AI自动谱曲自动演唱
AI日报|文生语音大模型国内外均有突破,Pika完成6亿新融资,视频大模型也不远了!
字节跳动推出文本到语音模型家族——SEED TTS,其核心亮点在于生成的语音音色高度接近人类,在相似度与自然流畅度方面,可以与真声媲美。
可信AI进展
2024/06/07
3050
一键生成歌曲,腾讯AI Lab开源音乐生成大模型 SongGeneration
6月20日,腾讯AI Lab推出并开源音乐生成大模型SongGeneration,专注解决AIGC音乐中音质、音乐性与生成速度这三大难题,基于LLM-DiT的融合架构,模型在保持生成速度的同时,显著提升了音质表现,生成歌曲准确度相较部分商业闭源模型表现出相当甚至更优的质量,同时在整体表现、旋律、伴奏、音质与结构等维度也优于现有多数开源模型。
腾讯开源
2025/06/24
6610
一键生成歌曲,腾讯AI Lab开源音乐生成大模型 SongGeneration
谷歌魔改「世上只有妈妈好」:随便你跑调,配不出BGM算我输
---- 新智元报道   编辑:LRS 【新智元导读】再也不用害怕唱歌跑调了!(是调跑了。) Google最近发布了一个全新的伴奏生成模型SingSong,用户先唱歌,再给你自动生成一个伴奏,这下不是跑调了,而是调跑了! 论文链接:https://arxiv.org/abs/2301.12662 演示链接:https://storage.googleapis.com/sing-song/index.html 拿一首Steven A. Clark的Bounty为例,先听一下从原曲中分离的人声。 再听听
新智元
2023/02/24
3450
谷歌魔改「世上只有妈妈好」:随便你跑调,配不出BGM算我输
一个开源库搞定各类文本到音频生成,Meta发布AudioCraft
近来,Meta 发布并开源了多个 AI 模型,例如 Llama 系列模型、分割一切的 SAM 模型。这些模型推动了开源社区的研究进展。现在,Meta 又开源了一个能够生成各种音频的 PyTorch 库 ——AudioCraft,并公开了其技术细节。
机器之心
2023/09/08
5430
一个开源库搞定各类文本到音频生成,Meta发布AudioCraft
【AIGC】内容创作——AI文字、图像、音频和视频的创作流程
近年来,生成式人工智能(AIGC,Artificial Intelligence Generated Content)技术迅速发展,彻底改变了内容创作的各个领域。无论是文字、图像、音频,还是视频,AI都在推动着创作流程的颠覆性变革。本文将详细介绍AIGC在内容创作中的应用,并分析其背后的技术及对未来的影响。
2的n次方
2024/10/15
1.5K0
【AIGC】内容创作——AI文字、图像、音频和视频的创作流程
OpenMusic:新手友好!用AI轻松创作、普通GPU+几行代码生成高质量音乐 - 本地安装
我将向你展示一个精彩的项目,它可以让你从文本生成音乐。而且,只需使用普通的 GPU 内存,非常简单。我们将进行一步一步的教程,教你如何在本地安装,然后只需一个简单的文本提示,你就可以创建出色的高质量音乐。
AI进修生
2024/12/02
4360
OpenMusic:新手友好!用AI轻松创作、普通GPU+几行代码生成高质量音乐 - 本地安装
算法音乐往事:二次元女神“初音未来”诞生记
音乐的诞生甚至早于语言,人类对于音乐的探索却从未停止。从最初的“音乐骰子”到如今火遍二次元的宅男女神“初音未来”,算法与音乐之间的故事,才刚刚开始。
大数据文摘
2018/07/31
8460
算法音乐往事:二次元女神“初音未来”诞生记
从 0 到 1,揭秘中国首个 AI 音乐 SOTA 模型
但音乐创作是一件门槛很高的事情,因为音乐创作不是某一个人的独角戏,而一个团队高度协作的过程。从作词、作曲到编曲、混音,再到歌曲录制,每个环节都需要专业音乐人付出努力,并伴随着高昂的成本投入。
AI科技评论
2024/04/26
1.4K0
从 0 到 1,揭秘中国首个 AI 音乐 SOTA 模型
推荐阅读
MusicLM来了!谷歌出手解决文本生成音乐问题,却因copy风险不敢公开发布
3860
谷歌AI练习生写了首歌,网友听完心率都低了
3790
国内首款AI音乐大模型一曲封神!核心技术业内首公开,爆改霉霉周杰伦效果惊艳
2820
Meta开源文本生成音乐大模型,我们用《七里香》歌词试了下
5980
音乐界迎来自己的DeepSeek!全球首个音乐推理大模型Mureka O1上线,超越Suno
2400
配乐行业危,谷歌出手解决音乐伴奏问题,人均音乐人不远了
3190
这AI绝对偷了格莱美奖杯!直接把LLaMA喂成乐坛顶流:开源版Suno来了!
1280
秒变莫扎特、贝多芬,Facebook提出完美转换音乐风格的神经网络
6590
用户暴涨近300万,国产AI音乐神器Mureka重磅升级V7,我们拿它复刻了「印度神曲」
2130
金山软件北京办公区开工;华为公开全新立体投影专利;小鹏吉利汽车智能化升级丨每日大事件
3730
强大的AI网站推荐(第五集)—— Suno
3670
高质量AI歌曲生成器ACE-Step一键启动整合包,AI自动谱曲自动演唱
3640
AI日报|文生语音大模型国内外均有突破,Pika完成6亿新融资,视频大模型也不远了!
3050
一键生成歌曲,腾讯AI Lab开源音乐生成大模型 SongGeneration
6610
谷歌魔改「世上只有妈妈好」:随便你跑调,配不出BGM算我输
3450
一个开源库搞定各类文本到音频生成,Meta发布AudioCraft
5430
【AIGC】内容创作——AI文字、图像、音频和视频的创作流程
1.5K0
OpenMusic:新手友好!用AI轻松创作、普通GPU+几行代码生成高质量音乐 - 本地安装
4360
算法音乐往事:二次元女神“初音未来”诞生记
8460
从 0 到 1,揭秘中国首个 AI 音乐 SOTA 模型
1.4K0
相关推荐
MusicLM来了!谷歌出手解决文本生成音乐问题,却因copy风险不敢公开发布
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档