十七岁的Daniil Frants和他的伙伴们希望通过自然流畅的对话来帮助听力障碍人士
大多数听力受损的人都可以轻松阅读嘴唇,这是一种常见的误解。虽然许多人确实是唇读者,但只有30%到40%的英语可以通过观察嘴来理解。大部分英语口语都没有唇部运动,而许多声音,如“b”和“p”,看起来完全相同。
这使得许多听力受损的人在与听证会沟通时感到茫然。最近的一些技术创新试图解决这个问题,从将语言转换为智能手机上的文本的设备到投机系统,以允许聋人通过他们的语言“听到”。来自科罗拉多州立大学的研究人员正在开发一种耳机,可将声音转换为电子模式,然后发送给固定器。
现在,一家公司希望以更加无缝的方式帮助听障人士。在直播时字幕系统(LTCCS)立即将语音转化成文字滚动显示夹在一对眼镜的小屏幕上。目前,在概念验证阶段,LTCCS的创始人称其“恢复了用户参与自然流动对话的能力”。
当他的吉他老师问他是否认为谷歌玻璃能够以某种方式帮助他与听力受损的父亲沟通时,LTCCS的创造者Daniil Frants受到了设计灵感。
“我开始搞乱谷歌眼镜,看看它是否可以做一些隐藏式字幕功能,”他说。“但是六个月后很明显,没有办法有效地使用Glass。”
所以弗兰特决定亲自去做。他创建了一个由现有或改进的部件构建的系统 - 一个Raspberry Pi微型计算机,一个语音识别系统和一个改编自他在在线技术论坛上发现的显示器。用户佩戴麦克风,麦克风连接到微型计算机。微型计算机使用语音识别软件拾取声音并将其转换为文本,然后通过一副眼镜将它们发送到显示器。
顺便说一句,Frants是17岁。他的Frants Innovators公司副总裁Ilan Pesselev是14岁。他的团队其余成员是18岁以下。他们中的大多数人都在曼哈顿的同一所高中。
鉴于Frants尚未上大学或研究生院,我向弗兰特询问他在哪里学习创建LTCCS的技能。他解释说,他的父亲教他一些基本的编程技巧,他自学了其余的。
“如果我需要学习新东西,我会谷歌一堆东西,”他说。
虽然“谷歌搜索的东西”可能无法帮助普通人找出这么复杂的系统,但弗兰茨并不是平均水平。14岁时,他是最负盛名的麻省理工学院媒体实验室实习生,该实验室专注于人机研究(想想“智能”假肢和智能机器)。他还参与了在世界各地展出的网络艺术项目。
Frants和他的团队希望在2016年夏天之前有一个合适的原型。最终,该设备零售价为750美元。
在短期内,最近出现在“今夜节目主演吉米法伦”的弗兰特希望在麻省理工学院学习计算机科学。从长远来看,他希望看到他的公司Frants Innovators成为新思想的中心。
“就像达尔文主义的想法一样,最终有些人会死掉,剩下的就是最好的主意,”他说。“我希望LTCCS是第一个想法。”
领取专属 10元无门槛券
私享最新 技术干货