1. 王位纷争
有这样一种说法,钢琴是 “乐器之王”。
的确,钢琴拥有宽广的音域,仅凭一件乐器,就能Cover 住整个管弦乐队的音域。
加之其普及程度高,学习者甚众,这 “乐器之王” 的美名也算实至名归。
然而,对于钢琴这个王位的合理性,全世界的朋友们看法都是一致的吗?
当我问 Google 这个问题时,Google推荐算法给我的排名是这样的
呼声最高的 “王位竞争者” 是管风琴,其次是小提琴,再次是莫扎特(大雾),钢琴连前三都没挤进去,只排在第四位。
也有道理,管风琴的音域不输钢琴,且在音量和气势上碾压钢琴;而小提琴,虽然我们一般称其为 “乐器之后”,可它诞生的时间要比钢琴早两个多世纪,按道理讲,有王才有后嘛。
如此说来,竖琴也有资格挑战这个称号,它的历史要比钢琴和小提琴加起来还长好几倍。
而论及普及程度,吉他又站了出来,本乐器携带方便,学习曲线平缓,练上个把月就能弹出简单的曲子出去撩……
争论 “究竟哪种乐器才是乐器之王” 这个命题,永远都不会有确切的答案。
所以我们换个问法:
在不同的历史时期,哪种乐器的影响力最大?
这个切入点,就好下手多了。
2. 王位争霸赛
(为了不干扰文章阅读,本文数据处理过程及细节均放在文末)
钢琴、小提琴、吉他、管风琴、竖琴,前文提到的这五种乐器,就是参与今天 “乐器之王” 争霸赛的五位选手。
1号选手钢琴,诞生于1709年,由意大利人巴托罗密欧·克里斯多佛利(Bartolomeo Cristofori,1655-1731)发明。
2号选手小提琴,诞生于文艺复兴时期(约16世纪),发明人不详。
3号选手吉他,祖先诞生于公元前3000年的古埃及,曾用名 “琉特琴 (lute)”、“比维拉琴 (Vihuela)” 等,13世纪在西班牙登记为现在的名称 “吉他 (guitar)”
4号选手管风琴,诞生于公元前250年,由古罗马人发明。
5号选手竖琴,诞生于新石器时代,跟我们会用火的时间一样长。
选手介绍完了,比赛开始。
3. 1750 - 1850
从图中可以看到,1750 到1850 这 100 年间,这五种乐器的热门程度基本上是相持不下的。
在这个时间段的早期,管风琴处于优势地位,而钢琴作为乐器界的后起之秀,在19世纪30年代左右迅速流行起来,到了1850年,已成为乐器界最炙手可热的明星。
这段时间,恰恰也是钢琴界最早一批明星活跃的年份,李斯特、肖邦等钢琴巨星对于这种乐器发展的巨大影响,不仅存在于乐评家的文字中,从客观数据上也可见一斑。
在钢琴开始流行之前,19世纪20年代开始,有一种神秘乐器超力压所有五位选手,就是图中那条天蓝色的线。
大家猜猜看,这件神秘的乐器究竟是什么呢?
4. 1850 - 2000
1850年后,钢琴的发展势不可挡,成为当之无愧的 “乐器之王”,而竖琴、管风琴及那种神秘乐器逐渐风头不再。
小提琴呢,20世纪70年代前,乐器圈儿二当家的地位一直十分稳定,可没想到没几年的时间,就被吉他迎头赶上。
吉他的数据表现非常具有戏剧性,从图中可以看到,吉他蓬勃发展的开始,有一个非常明显的拐点,这个拐点出现的时间是1957~1958年。
究竟是什么事件或是什么人物,仅用了两三年的时间迅速捧红了这种乐器?
我试着回溯这段时间的相关记录,然而并没有有价值的发现。
朋友们,你们的观点是什么呢?
5. 全局
为什么我要分两个时间段来讨论这个问题呢?我又为何会选择1850这个时间点来进行划分呢?
看过下面这张图,我想朋友们会秒懂。
19世纪50年代,这个时间,不仅仅是钢琴一种乐器腾飞的年代,所有乐器的影响程度均开始大幅度提升。
如果我不以1850年做切分,这之前的数据,几乎看出不什么差别。
除去 “乐器之王” 地位的演变,这笔数据还告诉我们这样一个事实:
随着时代的发展,音乐在人们日常生活中的地位越来越重要。
这句话不再是一句纯粹的鸡汤,现在,它有了客观数据支持。
6. 数据处理细节
「古典音乐大数据」项目,我并不是第一次做。
要回答今天这个问题,这批数据无论从时间跨度还是数据广度,都已不再适用。
这次我用到的数据源,是 Google Books 的 Ngram Viewer 项目。
简单讲,就是 Google Books 将其收录的,从1500年到2000年间,共60多万本书电子化,而后进行自然语言处理 (NLP),最后将其结果开源出来,供计量史学、语义学、社会学等研究领域使用。
如此,我们就能搜索特定词汇在某一年所有书籍中出现的词频。
举个例子,天堂 (heaven) 和地狱 (hell) 这两个词,自1800 年以来词频的变化趋势是这样的。
可以看到,地狱稳定不变,天堂自1830年后持续下降,终于在20世纪80年代跌穿地狱。(看来80后的生活是地狱模式,原来是有理论依据的)
这个数据,大致能反映这个词汇在相应时间段中的影响力。
这个探索项目中的数据处理细节如下:
1、数据集选用
选取的是 Google Books Ngram Viewer 项目中英文非虚构类作品数据集。
2、关键词选取
英语 “organ” 既有管风琴之意,又可以解释为 “器官”、“机构”;
英语 “harp” 既有竖琴之意,又可以翻译为 “喋喋不休”、“不住地说”。
为避免歧义,本项目中使用如下形式获取数据 “play=>guitar_NOUN”,即 “弹奏某乐器” 。
3、数据解释
Google的处理方式是N元模型 (n-grams) 消歧义,展示数据精度为e^-8。
大家如果有其它探索创意和想法,也可以留言给我,相信这个项目中一定能挖掘出更多有意思的结果和真相!
祝大家赏乐愉快!
领取专属 10元无门槛券
私享最新 技术干货