【ITBEAR】微软近日获得一项新专利,该专利构想了一种利用人工智能模型Copilot来为用户创作与视频、文本及PowerPoint等内容相匹配的音乐或背景音乐的方法。这一创新技术被命名为《Artificial intelligence model for composing audio scores》,它探讨了如何根据输入的内容来生成音乐。
专利文档中详细描述了技术的实现步骤:首先,系统会收集包含视频和音频的大量训练数据;接着,通过分析这些数据集,提取出如颜色、形状、运动及场景等不同类型的特征;最后,Copilot将寻找这些特征之间的关联性,例如特定场景通常伴随的音乐类型,从而生成与新的视频或文本内容相匹配的音频。
这项技术可广泛应用于多个领域,如电影、电视节目的背景音乐自动生成,为商业广告创作契合氛围的音乐,游戏中动态配乐的制作,以及通过音频增强虚拟现实中的沉浸式体验等。在日常生活中,它也能为特定场合如求婚等自动匹配合适的音乐,增添氛围。
领取专属 10元无门槛券
私享最新 技术干货