日前,数据专家提姆·布什利用机器学习算法写了首圣诞歌词,让古老的圣诞节充满了浓浓的AI 特色。
如何用大数据写出一首圣诞歌曲(来自Lynchpin)
AI 训练的数据来源于哥伦比亚大学拥有的百万首曲库,不过数据库太大,他最后选择了一个可以管理每个关键词的元数据库。利用SQL查询算法选出带有“圣诞节”“圣诞老”“Xmas”“驯鹿”“响叮当”等关键词,就可以获得3136首歌曲。
歌曲时常多少比较好呢?数据显示最长的圣诞歌有16.5分钟,最短的是来自1995年The Wiggles专辑中的一首If you see Santa,只有11秒。不过圣诞歌曲的均时长比一般歌曲均时长短。
对圣诞歌曲的时长分析(来自Lynchpin)
为了写出最受欢迎的歌词,提姆用Python的自然语言工具分析了50首最佳圣诞歌的歌词内容。
他还使用集群算法对歌词进行了聚类分析,歌词内容明显出现了三类风格,圣诞流行歌(提到Santa标红星、没有提到Santa的标黄星)和圣诞颂歌(紫星)。提姆创作的圣诞歌是机器学习随机产生的,基本韵律和意象都有,还需稍加润色,为歌曲添加一些抒情意义。
MDS图显示的是不同歌词的相似程度,每个数据点代表一首歌,越近代表越相似。(来自Lynchpin)
最后,一首《幸福就在落雪时》的圣诞歌就出炉啦:
【树在吟唱,似岁月流逝,当雪落之时,圣诞即至。
幸福就在落雪时,我的圣诞宝贝
我只想你知晓,遇见你之前,我只是一棵树
没有雪花妆点,歌唱也无知音,我怎会让你离开
幸福就在落雪时,我的圣诞宝贝】
你相信这是机器写出来的吗?简直到以假乱真的地步啦!不过这还不是happy ending哦,提姆还在计划用机器学习分析库中歌曲的旋律和节拍,说不定明年12月,你就能听到一首蕴含着科技感的圣诞旋律啦。
本文编译:秋慕小
原文来源:lynchpin
喜欢我的内容就关注我吧~ 咱们天天相守
本文来自企鹅号 - 科技特别有意思媒体
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文来自企鹅号 - 科技特别有意思媒体
如有侵权,请联系 cloudcommunity@tencent.com 删除。