“早春江上雨初晴,杨柳丝丝夹岸莺。画舫烟波双桨急,小桥风浪一帆轻。”
谁能想到,这是人工智能以“早春”为关键词创作的一首诗。作者“九歌”,由清华大学计算机科学与技术系孙茂松教授带领学生团队历时三年研发而成。
在综艺节目《机智过人》中,微软的聊天机器人小冰以一曲中国风歌曲《桃花梦》“险胜”人类对手。当歌手唱出“茫茫夜雨中,往事如风,耳边桃花笑春风,梦里你我相逢”这般古风浓郁的句子,很多观众以为这是人类所作。
写诗、作曲、绘画,人工智能创作的春天悄然到来……
技术上“熟读唐诗三百首”
微软亚洲研究院副院长周明是一个文艺爱好者。他和研究团队教会了小冰写现代诗,作曲则是新技能。
周明说,神经机器翻译、聊天机器人、阅读理解和创作是自然语言处理技术应用的四个主要方面,难度逐渐递增,创作处于金字塔顶端,最难突破。
“一开始,人们找不到怎么针对创作建模,因为它是感性的。写诗、作词,都是一些文采飞扬、灵感突现的东西,很难捕捉。”他说。得益于近年来深度学习和神经网络技术的进步,人工智能创作才屡获亮眼成绩。
周明介绍,小冰写歌是一个“编码与解码”过程。研究人员首先用流行歌曲训练人工智能机器人。训练充分后,就可开始创作:把歌曲主题以关键词形式输入后,就会被编码成人工智能可以理解的语言,机器人再以人能理解的方式解码输出,成为一句歌词;然后把这句词与原来输入的关键词合并作为新的输入,就可得到第二句,如此循环得到整首歌词。同样,也可输入歌词,对应翻译成曲谱,即把曲谱也看作自然语言,由此完成计算机作词谱曲。
“九歌”学写诗,也是“熟读唐诗三百首,不会作诗也会吟”。
“九歌”主创者、清华大学研究生矣晓沅输入了30多万首唐朝以来的古诗作为语料库,利用深度学习模型让计算机学习。除了对诗句平仄、押韵规定外,并未人为给出任何规则,而是让计算机自己学习古诗中的“潜规则”。
“计算机怎样作出这样的诗,我们也不知其中规则,”孙茂松说,这是深度学习的“黑箱”现象。在他看来,每首古诗像一串项链,项链上的珠子就是字词。深度学习模型先把项链彻底打散,然后通过自动学习,将每颗珠子与其他珠子的隐含关联赋予不同权重。作诗时,再将不同珠子重穿成新项链。
古人作诗多为抒发情志,风格偏悲愁,这也让“九歌”写的诗有些“伤春悲秋”。团队希望通过强化一些轻松情绪样本的训练,让“九歌”变得积极一些。此外,如何在保证全诗一致性的基础上写出更长的诗歌,也是新挑战。
领取专属 10元无门槛券
私享最新 技术干货