1分钟

课程背景

实验预计耗时:40分钟

1. 课程背景

1.1 课程目的

在移动端开发过程中,语音输入、输出已经成为流行趋势。但相比于文字内容,语音内容的识别和合成更加的复杂。为此,腾讯云提供语音识别ASR接口和语音合成TTS接口,可以对语音进行识别和合成,以此降低开发门槛,提升开发效率。

本课程以小程序云开发为例,通过制作趣味复读机,讲解如何在开发中调用语音识别ASR接口和语音合成TTS接口。此外,本实验还将涉及小程序云函数与腾讯云COS对象存储的应用。完成本实验,学员不仅可以学会在开发中调用ASR与TTS接口,还会对腾讯云COS与小程序云开发有初步的理解。

1.2 课前知识准备

1.相关概念

  • 小程序云开发:云开发为开发者提供完整的原生云端支持和微信服务支持,弱化后端和运维概念,无需搭建服务器,使用平台提供的 API 进行核心业务开发,即可实现快速上线和迭代,同时这一能力,同开发者已经使用的云服务相互兼容,并不互斥。
  • 小程序云函数:在云端运行的代码,微信私有协议天然鉴权,开发者只需编写自身业务逻辑代码。本实验需要使用云函数调用TTS接口。
  • 腾讯云COS对象存储:对象存储(Cloud Object Storage,COS)是腾讯云提供的一种存储海量文件的分布式存储服务。具有高扩展性、低成本、可靠安全等优点。通过控制台、API、SDK 和工具等多样化方式,用户可简单、快速地接入 COS,进行多格式文件的上传、下载和管理,实现海量数据存储和管理。本课程主要使用腾讯云COS存储合成的语音并提供语音的相应地址。关于对象存储COS的更多信息,可以参考 对象存储官方文档

2.相关原理

  • 实体语音机器人实现原理:语音机器人将外界的语音转化成语音流的形式,调用实时ASR接口识别语音,将结果返回给语音机器人,语音机器人再调用实时TTS接口将合成的语音转换成语音流的形式输出。原理流程图如图所示。
实体语音机器人原理图
  • 趣味复读机小程序实现原理:模仿实体语音机器人的实现流程。用户向小程序说一段语音,小程序调用腾讯云ASR语音识别接口将语音转为字符串,继续调用腾讯云TTS语音合成接口将字符串合成对应的语音,返回Base64编码的字符串,此字符串小程序无法直接转换成语音。小程序将字符串解码并上传至腾讯云COS,返回可访问的公网地址,小程序通过公网地址播放语音。原理流程图如图所示。
复读机器人小程序实现原理图