今日,昆仑万维人工智能团队向全球音乐爱好者及专业人士抛出了一颗震撼业界的创新炸弹——其自主研发的AI音乐生成大模型「天工SkyMusic」正式启动邀测,标志着音乐创作领域迎来了一场前所未有的革命。
这款基于「天工3.0」超级大模型打造的音乐神器,不仅是中国首款公开可用的AI音乐生成大模型,也是目前该领域的技术巅峰之作。
据悉,昆仑万维在本次邀测活动中,特别释放了1000个宝贵的免费试用名额,邀请行业媒体、专业音乐家以及广大音乐爱好者共同见证并体验这款产品的神奇魅力。
符合条件的用户可通过指定申请网页提交资料,昆仑万维承诺将在收到申请后的第一时间作出回应。
同时,4月17日,「天工SkyMusic」的正式版本也将伴随「天工3.0」一同面向全社会免费开放。
在通往AGI(通用人工智能)的漫漫长路上,昆仑万维另辟蹊径,选择了情感AGI作为重要的研究方向。
他们敏锐洞察到,相较于文字和图片,音频尤其是音乐更能深刻触达人类内心的情感世界,跨越时空和文化的界限。
因此,「天工SkyMusic」应运而生,它不仅能够依据用户提供的歌词创作出与之情绪相匹配的高质量音乐,还能够精准把握音乐中的情感脉络,使作品呈现出丰富饱满的人性化表达。
「天工SkyMusic」凭借其独特且先进的自研类Sora模型架构,实现了Large-scale Transformer谱曲与Diffusion Transformer演唱的完美结合。
前者通过对Music Patches上下文依赖关系的学习,确保音乐逻辑连贯且易于控制;后者则利用LDM技术将音乐片段高效还原为细腻逼真的高质量音频,从而支持生成长达80秒、采样率为44100Hz的双声道立体声歌曲。
这样的技术实力不仅在音乐领域展现出了卓越的效果,同时也在视频和音频处理方面彰显出其不俗的能力。
「天工SkyMusic」所展现出的五大核心特性尤为引人瞩目:
1. 高质量AI音乐:能够生成高清立体声的AI歌曲,而且能根据用户输入的不同歌词风格灵活生成对应的音乐风格;
2. 人声“以假乱真”:其AI人声合成技术达到了业内顶级的SOTA水准,尤其在中文表现上可谓独步天下,发音纯正,毫无杂音,中文演唱效果达到同类产品水准,展现了中国AI技术在全球范围内的领先地位;
3. 歌词段落情感调控:允许用户通过歌词来细致把控整首歌曲的情绪节奏,确保歌曲各部分如主歌、副歌、前奏之间的转换自然流畅,情感层次分明;
4. 多元音乐风格兼容:支持涵盖说唱、民谣、放克、古风、电子在内的多种音乐风格,创作者可以根据个人喜好或者参考音频定制自己的音乐风格;
5. 音乐智能表达与歌唱技巧学习:在情感表达上更进一步,「天工SkyMusic」不仅能掌握多种歌唱技巧,如颤音、歌剧式演唱、吟唱、男女对唱以及自动和声等,赋予作品更为丰富的音乐表现力。
昆仑万维早先推出的「昆仑天工」AIGC全系列开源算法与模型,已然包含了多模态音乐内容生成大模型的成果,而此次「天工SkyMusic」的推出,则再次证明了他们在AI音乐生成领域的持续深耕。
事实上,昆仑万维已成功运用此款音乐大模型为北京市东城区域的“故宫以东”文商旅融合项目打造出年度数字主题曲,生动诠释了AI音乐前沿技术与本土文化深度交融的可能性。
展望未来,昆仑万维创始人周亚辉先生强调,“未来的三十年将是人类社会从感知走向表达的时代,个体的自我表达需求将以千倍级的速度增长。
创作和自我表达将成为社交文化领域增长最快的趋势,而AI的作用就是降低创作门槛,让更多人得以轻松自如地表达自我,表达对世界深层次的理解和个人独特的态度。”
在2024年,昆仑万维发布了全新的公司使命——“实现通用人工智能,让每个人更好地塑造和表达自我”。
这一宏大愿景不仅是对技术创新的极致追求,更饱含着对企业社会责任和人文关怀的深切思考。昆仑万维致力于借助通用人工智能的力量,构造一个智慧互联、懂得体察人心、尊重个性化表达的新世界。
音乐,作为人类情感沟通的重要媒介,在这个宏伟蓝图中占据了至关重要的位置。
通过「天工SkyMusic」,昆仑万维意在赋能每一个热爱音乐、渴望表达的人,让他们能够更好地创作出承载情感、传达心声的音乐作品。
如今,昆仑万维已在AI领域全面布局,形成包括AI大模型、AI搜索、AI音乐、AI漫画、AI社交、AI游戏等多个子板块构成的业务矩阵。
随着「天工3.0」多模态超级模型的横空出世,昆仑万维无疑在AI行业中树立了新的里程碑,而「天工SkyMusic」正是这幅宏图中那颗璀璨夺目的音乐之星,它将引领着我们进入一个全民创作、情感流淌的新音乐纪元。
领取专属 10元无门槛券
私享最新 技术干货