铅笔道获悉,音视频智能感知技术研发商“声联网”已于去年12月获得天使轮投资,投资方为深圳市高新投集团。
父母都想要有效发现婴幼儿啼哭等声音,并了解背后的含义,同时获得相应的应对方法。声联网(深圳声联网科技有限公司)则希望利用技术自动解决这一难题,公司主要从事婴幼童音视频的行为分析和情感计算。
目前声联网已经研发了基于人工智能技术的婴幼儿音频行为监护平台(BabyABAM),通过芯片和云后台,可以实现实时精确监测婴幼儿发出的啼哭等声音,并已经与国内一些合作伙伴达成了合作及合作意向,有望在软硬件终端产品中迅速落地这一技术。
声联网自研了一套算法方案,增加了更多如音高、音强、音色等各种特征维度在内的分析维度,提升识别的准确性。精准标注的训练数据是提升识别准确率的一个重要因素。团队表示,公司用来训练的婴儿音频数据超过了1000GB,上万小时的录音文档;采用了统计建模和神经网络建模的算法,目前的错误率可以低至5%以内,是国内可量产方案中最低的。
目前,声联网的这一技术,主要通过SDK软件包或AVS7516音频识别芯片的方式提供,两款产品都已经更新至2.0版本,可以对宝宝哭、笑、喷嚏、咳嗽、饱嗝等监测和分析,可适用于智能摄像头、机器人、小夜灯、智能音箱、智能摇篮、智能玩具等产品。
产品推广方面,团队表示,SDK和芯片样品已经送至多家知名智能硬件制造商、母婴用品商、机器人公司进行测试,目前进展顺利。
目前声联网科技已经组建了25人的团队。总经理何宇新是中科院计算所博士,前北京汉王公司副总裁,语音合成企业宇音天下创始人。副总经理肖溪是荷兰鹿特丹大学硕士,前盈信投资集团助理总裁、前远古控股集团总经理助理,是精钻传媒、远航纵横前联合创始人。
编辑 | 杨茅
领取专属 10元无门槛券
私享最新 技术干货