最近讀報看到:一個正在鼻塞咳嗽的女子對智能音響說了句「我餓了」,這個設備馬上得出她感冒了的結論,並詢問她是否需要喝雞湯,被拒絕後,又建議購買止咳糖漿。有意思的是,感冒喝雞湯是不少西方人的習慣,而這個案例也發生在西方國家。如果說話者換成東方人,我想,智能音響很有可能建議沖一杯板藍根或者去做艾灸。因為和其他行為一樣,聲音裏包含的除了生理信息,還有文化密碼。不同文化背景中成長起來的人,連語氣詞的音調都會有所差別。
智能語音已經廣泛滲透到生活之中,對着空氣呼喚小愛、siri、小德,也早就見怪不怪。我們平時不太關注的是,當我們向智能助手發號施令時,它們從我們的聲音中獲取的信息遠大於指令本身。利用語音來判斷人格和情緒的做法,在營銷領域早已得到大規模應用。本文開頭的例子說明智能設備「練成」了聽聲辨病的「醫術」。更不可思議的是,聲音中竟然還包含着長相的信息。麻省理工學院的研究者根據一個人的語音小片段,利用人工智能,生成了此人面部的數字畫像,雖然還比較粗略,卻也預示着某種突破方向。
人的聲音獨一無二又內涵豐富,如此重要的東西,一旦被竊取,可能導致私人信息大洩密,或許,不遠的將來,簡單幾句話便足夠造出虛擬分身。這些年,智能場景日漸豐富,虛擬生活深度滲透,客觀上促進了人們隱私意識的提升,對人臉識別技術的討論,就是例證。我們忽然發現原來世上最重要的版權就是我們自己。這個本因為無法複製而被忽略了千萬年的原創品,現在成了最該保護的對象,而聲音無非是其中一部分。
保護聲音不容易。生活不是徐庶進曹營,無法做到一言不發。像《倚天屠龍記》裏的冷謙那般簡練地說話也過於困難。真正有效的做法還得靠完善技術倫理和建立管用的制度。
领取专属 10元无门槛券
私享最新 技术干货