首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Spectron: 谷歌的新模型将语音识别与语言模型结合进行端到端的训练

Spectron是谷歌Research和Verily AI开发的新的模型。与传统的语言模型不同,Spectron直接处理频谱图作为输入和输出。该模型消除归纳偏差,增强表征保真度,提高音频生成质量。...Spectron与众不同的是其独特的直接处理频谱图作为输入和输出的能力。谱图是音频信号中频率随时间变化的频谱的可视化表示。...Spectron利用中间投影层,和预训练语音编码器的音频功能,消除了通常困扰预训练编码器和解码器的归纳偏差。...虽然Spectron的潜力巨大,但它也有它的复杂性。比如过程需要生成多个谱图帧,这会很耗时。模型目前还不能并行处理文本和谱图解码。 Spectron的引入代表了人工智能领域的重大飞跃。...有兴趣的可以看看官网: https://michelleramanovich.github.io/spectron/spectron/ 还有论文: https://arxiv.org/abs/2305.15255

34620
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到
    领券