品玩8月22日讯,据 Github 页面显示,清华大学近日联手字节跳动,推出全新开源大语言模型SALMONN 。
据介绍,SALMONN支持语音、音频以及音乐输入,他可以感知和理解不同类型的音频内容输入,并具备多语言语音识别和翻译以及语音推理等功能。
据悉,SALMONN 与传统的语音识别、音频字幕生成等语音和音频处理任务相比具备更好的通用性,同时可以准确地听从使用者的指令。
分享快讯到朋友圈
领取专属 10元无门槛券
私享最新 技术干货