Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >用 C# 开发自己的语音识别程序

用 C# 开发自己的语音识别程序

作者头像
伍六七AI编程
发布于 2019-10-08 10:48:12
发布于 2019-10-08 10:48:12
1.9K00
代码可运行
举报
文章被收录于专栏:preparedprepared
运行总次数:0
代码可运行

准备工作

1、注册百度账号

2、登录百度 AI 开发平台,http://ai.baidu.com/

3、在控制台点击“百度语音”服务,点击“创建应用”,填写必填项,勾选额外接口,点击立即创建获取秘钥。在应用列表中查看自己的id

用 360 软件管家安装 vs2017

创建自己的项目

1、新建项目

打开 vs2017,点击文件,新建项目,选择 visual C# --> windows 桌面 --> windows 窗体应用,选择自己的项目地址,点击确定

2、添加 baiduai 开发包

点击引用 --> 管理 nuGet 程序包,搜索 baiduai,点击下载

3、UI 设计

直接拖动即可,生成界面如下

4、后台功能实现

选择文件按钮

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
private void button1_Click(object sender, EventArgs e)
{
    OpenFileDialog fdlg = new OpenFileDialog();
    fdlg.Title = "C# Corner Open File Dialog";
    //fdlg.InitialDirectory = @"c:/";   //@是取消转义字符的意思
    //fdlg.Filter = "All files(*.*)|*.*|All files(*.*)|*.* ";
    ///*
    // * FilterIndex 属性用于选择了何种文件类型,缺省设置为0,系统取Filter属性设置第一项
    // * ,相当于FilterIndex 属性设置为1.如果你编了3个文件类型,当FilterIndex =2时是指第2个.
    // */
    fdlg.FilterIndex = 2;
    ///*
    // *如果值为false,那么下一次选择文件的初始目录是上一次你选择的那个目录,
    // *不固定;如果值为true,每次打开这个对话框初始目录不随你的选择而改变,是固定的  
    // */
    //fdlg.RestoreDirectory = true;
    if (fdlg.ShowDialog() == DialogResult.OK)
    {
        //textBox1.Text = System.IO.Path.GetFileNameWithoutExtension(fdlg.FileName);
        filePath.Text = System.IO.Path.GetFullPath(fdlg.FileName);

    }
}

开始识别按钮

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
// 语音合成按钮
private void button2_Click(object sender, EventArgs e)
{
    string value = this.videoType.Text;
    String filePath = this.filePath.Text;
    // 设置APPID/AK/SK
    String APP_ID = "14433392";
    String API_KEY = "C7WMYgLeWv3Wm2yogwv5gD08";
    String SECRET_KEY = "xcvwiwikALBDBaIcGisNQ6aQImtj3qua";
    var client = new Asr(APP_ID, API_KEY, SECRET_KEY);
    client.Timeout = 60000;  // 修改超时时间
    client.Timeout = 120000; // 若语音较长,建议设置更大的超时时间. ms
    FileStream fs = new FileStream(filePath, FileMode.Open, FileAccess.Read);
    byte[] buffur = new byte[fs.Length];
    try
    {
        fs.Read(buffur, 0, (int)fs.Length);

    }
    catch (Exception ex)
    {
        Console.Write(ex.StackTrace);
    }
    finally
    {
        if (fs != null)
        {
            //关闭资源  
            fs.Close();
        }
    }
    var result = client.Recognize(buffur, value, 16000);
    Convert.ToString(result);

    JToken resultStr = null;
    result.TryGetValue("result", out resultStr);
    Console.WriteLine("aToken===>"+ resultStr);
    voiceResult.Text = Convert.ToString(resultStr);
    Console.Write(result);
}

开始合成按钮

调用 api 中 C# SDK语音合成 api

https://ai.baidu.com/docs#/AS...

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
// 开始合成按钮(语音合成功能)
private void synthesisButton_Click(object sender, EventArgs e)
{
    String APP_ID = "14433392";
    String API_KEY = "C7WMYgLeWv3Wm2yogwv5gD08";
    String SECRET_KEY = "xcvwiwikALBDBaIcGisNQ6aQImtj3qua";
    // 获取输入框的值
    String value = this.Speech_Synthesis.Text;
    // 将 value 转成语音文件存放到本地
    var client = new Baidu.Aip.Speech.Tts(API_KEY, SECRET_KEY);
    // 可选参数
    var option = new Dictionary<string, object>()
    {
        {"spd", 5}, // 语速
        {"vol", 7}, // 音量
        {"per", 3}  // 发音人,4:情感度丫丫童声
    };
    var result = client.Synthesis(value, option);
    try {
        if (result.ErrorCode == 0) { // 或 result.Success
            File.WriteAllBytes("E:/prepared/北航/07_工程实践--AI方向/作业/WindowsFormsApplication1/WindowsFormsApplication1/tmp.mp3", result.Data);
        }

    } catch (Exception ex) { Console.Write(ex.StackTrace); }
    Play();
}

源码地址:https://github.com/zhongsb/vo...

我的博客即将同步至腾讯云+社区,邀请大家一同入驻:https://cloud.tencent.com/dev...

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
python语音识别
语音识别技术,也被称为自动语音识别,目标是以电脑自动将人类的语音内容转换为相应的文字。应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。
py3study
2018/08/03
18.1K3
python语音识别
PHP与语音识别功能现在也是很普遍了
将语音实时识别为文字,适用于语音聊天、语音输入、语音搜索、语音下单、语音指令、语音问答等多种场景。
php007
2019/08/05
9290
10行内Python代码实现语音识别
Python在语音识别方面功能很强大,程序语言简单高效,下面编程实现一下如何实现语音识别。本文分享如何调用百度AI开放平台实现语音识别技术。
用户9925864
2022/07/27
1.4K0
10行内Python代码实现语音识别
一次绕口令引发的“血案"
春节在家一直闲着,今天有人给我发了一个小程序,即包你说。小程序是一个绕口令,很显然对于我这种 "n l" 不分的人说,这种绕口令也太难说了。因此我就想通过 python 脚本来实现。
madneal
2022/03/11
2270
一次绕口令引发的“血案"
从零开始搭建一个语音对话机器人
最近在研究语音识别方向,看了很多的语音识别的资料和文章,了解了一下语音识别的前世今生,其中包含了很多算法的演变,目前来说最流行的语音识别算法主要是依赖于深度学习的神经网络算法,其中RNN扮演了非常重要的作用,深度学习的应用真正让语音识别达到了商用级别。然后我想动手自己做一个语音识别系统,从GitHub上下载了两个流行的开源项目MASR和ASRT来进行复现,发现语音识别的效果没有写的那么好,其中如果要从零来训练自己的语言模型势必会非常耗时。
好好学java
2019/08/23
11.9K1
从零开始搭建一个语音对话机器人
使用 Python 实现一个简单的智能聊天机器人
最近两天需要做一个python的小程序, 就是实现人与智能机器人(智能对话接口)的对话功能,目前刚刚测试了一下可以实现, 就是能够实现个人与机器的智能对话(语音交流)。
周萝卜
2022/05/22
2.8K0
使用 Python 实现一个简单的智能聊天机器人
用Python做个电脑人脸屏幕解锁神器
最近突然有个奇妙的想法,就是当我对着电脑屏幕的时候,电脑会先识别屏幕上的人脸是否是本人,如果识别是本人的话需要回答电脑说的暗语,答对了才会解锁并且有三次机会。如果都没答对就会发送邮件给我,通知有人在动我的电脑并上传该人头像。
用户8544541
2022/01/27
2K2
用Python做个电脑人脸屏幕解锁神器
百度AI接口开发文字转语音功能
今天做了一个功能,开始一个文字转语音的功能,主要应用于网站文章阅读。使用了百度AI的语音合成接口。下面详细的来说一下;
申霖
2020/04/01
1.3K0
百度AI接口开发文字转语音功能
AI百度接口以及图灵接口的使用
耳朵 = 倾听 = 麦克风 = 语音识别 ASR:Automatic Speech Recognition
GhostCN_Z
2020/04/03
9020
AI百度接口以及图灵接口的使用
3分钟实现语音播报微博热搜
这个页面不需要用户登录,就能获取页面数据,所以我们不需要考虑登录时获取token的问题,这个下次会单独做个视频讲解。
小雯子打豆豆
2020/06/19
9050
百度语音识别pom引入jar工具类
pom引入jar <!--mp3转pcm--> <dependency> <groupId>com.googlecode.soundlibs</groupId> <ar
用户5899361
2020/12/07
9980
C# 10分钟完成百度语音技术(语音识别与合成)——入门篇
我们现在就基于百度Ai开放平台进行语音技术的相关操作,demo使用的是C#控制台应用程序。
梁规晓
2019/08/09
4.4K0
C# 10分钟完成百度语音技术(语音识别与合成)——入门篇
【Python3爬虫】自动查询天气并实现
之前写过一篇用Python发送天气预报邮件的博客,但是因为要手动输入城市名称,还要打开邮箱才能知道天气情况,这也太麻烦了。于是乎,有了这一篇博客,这次我要做的就是用Python获取本机IP地址,并根据这个IP地址获取物理位置也就是我所在的城市名称,然后用之前的办法实现查询天气,再利用百度语音得到天气预报的MP3文件,最后播放,这样是不是就很方(tou)便(lan)了呢?
py3study
2020/01/17
7290
C# 10分钟完成百度人脸识别——入门篇
点击去创建自己的应用名称,其实最主要的就是 API_key 和 Secret_key
zls365
2020/08/19
1.2K0
C# 10分钟完成百度人脸识别——入门篇
python自制有声小说
最近工作中测试ASR,语音识别系统。人工读太累,想自动化来实现。给一段text,能给我发出正确的声音,然后按住按钮,产品能够录制下来并且正常识别。
赵云龙龙
2020/08/13
4.4K1
Python爬虫之验证码识别
Python爬虫之验证码识别 #识别车牌号 from aip import AipOcr import re APP_ID = '15469265' API_KEY = 'rAGFtOChXtO7mnRPiwXg1Frf' SECRET_KEY = 'Ailvoijh4X7lQIAoZ58UsGPlaDCmLIt7' client = AipOcr(APP_ID, API_KEY, SECRET_KEY) """ 读取图片 """ def get_file_content(filePath):
yuanshuai
2022/08/22
4730
python实现语音在线合成,让你的小说自己念给你听
有声小说相信大家都不陌生了, 里面的音频基本都是一些声优录制的。其实除了录制音频, 咱们可以利用百度开放的api接口使用python语言在线合成语音。
松鼠爱吃饼干
2020/09/15
1.5K0
python实现语音在线合成,让你的小说自己念给你听
无法复制PDF的文字内容?只能说你没有看过这篇文章
先说说我为什么要写这篇文章,在这之前,我遇到了一个问题,就是复制不了PDF的文字内容,而我偏偏又想获取到。 我尝试了很多办法,先是将PDF转成Word文档,这样就可以从文档中把内容复制出来了,但是这些格式转换的工具基本都收费,自然就不用再考虑了。 我还想过将要复制的文字部分截图下来,然后发到手机上,通过手机QQ的提取文字内容功能将文字提取出来然后复制:
wangweijun
2020/02/14
2.4K0
Python在线语音识别速成案例 | 手把手快速尝鲜百度语音技术SDK包 | 机器语音
对于语音识别初学者来说,通过简单案例快速上手,不仅能够快速了解语音识别等实际应用模式,对枯燥无味的学习中提升兴趣值也大有帮助。百度语音提供了语音识别、语音合成和语音唤醒等产品的SDK免费资源,是面向广大开发者永久免费的开放语音技术平台,且简单易用,可以作为学习之余练手的好去处。
用户7623498
2020/08/04
2.4K0
Python在线语音识别速成案例 | 手把手快速尝鲜百度语音技术SDK包 | 机器语音
基于http的百度语音 REST api
什么是REST api? -- REpresentational State Transfer REST api是基于http请求的一种api,就百度语音识别的实例来讲,通过百度提供的url加上经过编码的音频文件,向百度服务器发出请求,然后百度服务器返回识别的内容。结束。
Mshu
2018/10/31
2.2K0
相关推荐
python语音识别
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验