首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >用腾讯云 AI 语音识别打造会议小帮手

用腾讯云 AI 语音识别打造会议小帮手

原创
作者头像
就叫7620521吧
修改于 2022-11-30 05:51:55
修改于 2022-11-30 05:51:55
9K20
代码可运行
举报
文章被收录于专栏:征文活动专栏征文活动专栏
运行总次数:0
代码可运行

开会是工作中经常做的一件事情,会议记录是一件让人烦恼的事情。听不清,记不住是时有发生的,很多人也对此很苦恼,如果说要想会议达到一个比较好的效果,那不妨用腾讯云AI语音识别打造一个小帮手,对会议录音进行识别,用cv大法来写会议纪要。

准备事项

  1. 需要一台有公网ip的云服务器,这里推荐选择腾讯云轻量应用服务器
  2. 本文采用vue+node.js技术栈来搭建
  3. 购买腾讯云AI语音识别资源包,活动首单只要9.9元包含30小时录音转文字(可以先用新用户专享资源包,包含十小时录音转文字)

node配置项

引入腾讯云包命令

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
npm install tencentcloud-sdk-nodejs --save

必要的参数配置和文档入口

点击查看腾讯云id和key

点击查看node.js官方指导文档

点击查看语音识别官方示例和参数文档

node代码

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制

const tencentcloud = require("tencentcloud-sdk-nodejs");
const CvmClient = tencentcloud.asr.v20190614.Client;
// 引入node中间间 用于保存音频文件
const multer = require("multer");
const path = require("path");

const clientConfig = {
	// 腾讯云认证信息
	credential: {
		secretId: //"腾讯云id",
		secretKey: // "腾讯云key",
	},
	// 可选地区 官方文档提示:非必要参数
	region: "ap-shanghai",
	// 可选配置实例
	profile: {
		signMethod: "HmacSHA256", // 签名方法
		httpProfile: {
			endpoint: "asr.tencentcloudapi.com", // 请求地址
			reqMethod: "POST", // 请求方法
			reqTimeout: 60, // 请求超时时间,默认60s
		},
	},
}var storage = multer.diskStorage({
	// 配置文件上传后存储的路径
	destination: function (req, file, cb) {
		// console.log(__dirname);  //获取当前文件在服务器上的完整目录 
		// console.log(__filename); //获取当前文件在服务器上的完整路径
		cb(null, path.join(__dirname, '../img'))
	},
	// 配置文件上传后存储的路径和文件名
	filename: function (req, file, cb) {
		var filename = Date.now() + path.extname(file.originalname)
		cb(null, filename)
	}
})
var upload = multer({ storage: storage })// 下面upload.single中的video要与前端给的名称一致
router.post('/video', upload.single('video'), (req, res) => {
	
	// 拼接储存到服务器的音频的地址+名称
	let url = '存储音频文件的url' + req.file.filename;
	// 配置必要的参数 详细可查看官方文档
	// 这里写死了,可以根据需求配合前端自由定制传参数据
	var obj = {
	// 可在公网访问的url
		'Url': url,
		"ChannelNum": 1,
		"EngineModelType": "16k_zh",
		"ResTextFormat": 2,
		"SourceType": 0
	}
	const client = new CvmClient(clientConfig)
	// 把上面写好的参数放进去
	client.CreateRecTask(obj).then(
		(data) => {
	// 文档推荐轮询请求 这里设定每隔五秒调用一次直到状态为2 说明成功了
			let poll = setInterval(() => {
				client.DescribeTaskStatus(data.Data).then(
					(data) => {
						console.log(data);
						if (data.Data.Status == 2) {
						// 把拿到的参数返回给用户
							res.json({
								code: 200,
								data: data.Data.Result
							})
							// 结束重复请求
							clearInterval(poll)
						}
					},
					(err) => {
						console.error("error", err);
						clearInterval(poll)
					}
				);
			}, 5000);
		},
		(err) => {
			console.error("error", err)
		}
	)
})

前端代码

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
<template>
	<div id="app">
		<div class="main">
			<div>
			// ref一个video虚拟dom accept是文件类型audio是音频类型 @change选中文件触发
				<input @change="getText()" type="file" accept="audio/*" ref="video" />
			</div>
			<div>
			
				<textarea v-model="data" name="" id="" cols="30" rows="10"></textarea>
			</div>
		</div>
	</div>
</template>

<script>
	import axios from 'axios';

	export default {
		data() {
			return {
			
				data: '',
			}
		},
		methods: {
			getText() {
				// 接口
				let url = '接口';
				// 拿虚拟dom
				let video = this.$refs.video;
				let fileVideo = video.files[0];
				let formData = new FormData();
				// 这里定义的名称需要和node一致
				formData.append("video", fileVideo);
				axios.post(url,formData).then((res) => {
					this.data = res.data.data
				})
			}
		},
	}
</script>

<style>
	#app {
		width: 100%;
		height: 500px;
	}

	.main {
		height: 100%;
		display: flex;
		justify-content: center;
		align-items: center;
	}
	div {
		flex: 1
	}
</style>

实际效果

新版:

旧版:

线上demo地址

点击跳转试用

官方试用地址

开源地址:https://gitee.com/diss998/tencent-cloud-ai-voice-to-text

产品特性

价格低

购买预付费包更加优惠,识别1小时语音不到1元。每月赠送免费额度,最大程度降低客户成本。

效果好

字准率97%处于业界领先水平,与微信、王者荣耀的语音转文字使用一套服务,效果一样好。

语种多

已经支持中文普通话、英语、粤语、日语、泰语和上海话等23种方言的语音识别,后续将持续开放其他语种和语言的识别能力

算法强大

基于创新网络结构 TLC-BLSTM,利用 ATTENTION 机制有效地对语音信号进行建模,通过 Teacher-Student 方式提升系统鲁棒性,对通用以及垂直领域下场景有领先业界的识别精度和效率。

自助提升准确率

针对垂直领域,上传词表或句子即可完成语言模型的自动优化,借助自训练平台,不懂算法也可轻松实现定制化模型,进一步提升识别准确率。

支持场景丰富

经过内部微信、腾讯视频、王者荣耀等大流量产品的充分验证,在互联网、金融、教育等领域,基于海量数据实现分场景优化,积累了多行业的最佳实践。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
2 条评论
热度
最新
好文章 请问有实验的完整源代码吗
好文章 请问有实验的完整源代码吗
111举报
还在审核
还在审核
回复回复1举报
推荐阅读
编辑精选文章
换一批
对象储存cos-腾讯云对象储存cos
COS是腾讯云提供的对象存储服务,功能非常强大,可以作为文件服务器,CDN加速,静态网页服务,还提供了图片的常用操作。
张天华
2019/08/01
25.4K0
对象储存cos-腾讯云对象储存cos
腾讯云语音识别(ASR)助力智慧园区落地
语音识别,也称为自动语言识别(Automatic Language Identification, ALI),是自然语言处理(NLP)领域的一个重要研究方向。它旨在让计算机能够自动地识别出给定文本所属的语言种类。这一技术对于跨语言交流、多语言信息处理、机器翻译等方面具有广泛的应用价值。
不惑
2024/05/25
8853
腾讯云语音识别(ASR)助力智慧园区落地
微信小程序实时语音识别实践
安装2.0版本以上的git客户端,如果你的系统是Centos发行版的,可以参考下面的安装演示;如果是其他发行版,可以参考git官网指引,通过简单的命令即可安装
张世强
2020/07/31
10.7K0
微信小程序实时语音识别实践
vue获取上传文件路径_vue中文件上传及接收「建议收藏」
this.imageUrl = URL.createObjectURL(file.raw);
全栈程序员站长
2022/09/22
4.1K0
腾讯云语音识别.net-sdk使用笔记0818
github的地址:https://github.com/TencentCloud/tencentcloud-sdk-dotnet/tree/master/TencentCloud/Asr/V20190614
算法发
2020/08/18
1.9K0
腾讯云语音识别.net-sdk使用笔记0818
实现一个前后端结构的语音识别小程序服务
一、实现方式:通过录音管理器 RecorderManager调用手机的录音功能实现音频的在线获取,并将获取到的音频传入到服务端,服务端调用腾讯云“一句话识别”API将音频中的文字提取出来回调到小程序端
张世强
2020/04/17
2.8K0
实现一个前后端结构的语音识别小程序服务
最佳实践 | 用腾讯云智能语音打造智能对话机器人
在AI技术的推动下,智能对话机器人逐渐成为我们工作、生活中的重要效率工具,乃至是伙伴,特别是为企业带来最原始最直观的“降本增效”落地实现。
腾讯云AI
2023/04/06
5.7K0
最佳实践 | 用腾讯云智能语音打造智能对话机器人
微信会话语音文件的一句话识别
在wordRecognize云函数目录上右键选择在"在终端中打开",执行"npm install"安装依赖
张世强
2020/07/24
2K1
微信会话语音文件的一句话识别
基于腾讯云智能语音的实时语音识别微信小程序的开发
本文介绍了一种基于腾讯云智能语音的实时语音识别微信小程序的开发和实现。该小程序使用Wafer服务器进行音频文件的上传和识别,利用腾讯云的语音识别API进行实时语音转文字,并将识别结果展示在小程序中。具体实现包括搭建项目结构、配置服务器、上传音频文件、添加识别和转文字功能、以及处理异常情况等。该小程序可以方便地在手机端进行调试和体验。
Jason
2017/12/18
30.9K7
基于腾讯云智能语音的实时语音识别微信小程序的开发
不用写一行代码,deepseek结合腾讯云语音识别来批量转录Mp3音频
不用写一行代码,deepseek结合腾讯云语音识别来批量转录Mp3音频 首先,打开window系统中的cmd命令行工具,或者powershell,安装腾讯云t
AIGC部落
2024/06/23
2.6K0
不用写一行代码,deepseek结合腾讯云语音识别来批量转录Mp3音频
玩转腾讯云语音识别
随着互联网时代的进步,智能产品逐渐配备了更加多元化的功能应用、更加丰富的内容资源,用户在使用语音相关的功能时,越来越多的需求需要向智能产品用户提供更便捷的操作体验,语音转换成文本,语音识别是人工智能领域极为重要的前沿技术,实现快速、高效、准确的语音识别及控制,实现智能行业内全新的便捷操作模式。
用户10585271
2024/05/22
2.5K2
玩转腾讯云语音识别
用腾讯云 AI 录音文件识别 ,实现本地语音转文字
经常遇到身边的朋友,想从视频中提取出文字,尤其是自媒体博主,如果能直接把视频转换成文章,那可太省时间了。
程序员晚枫
2022/09/29
18.9K4
用腾讯云 AI 录音文件识别 ,实现本地语音转文字
【玩转腾讯云】语音转文字,轻松写笔记
没天总是不停的开会,会议内容又多又发散!音频文件整理困难,搜索不到终点,占用空间大,不利于分享和传达!
tonglei0429
2021/05/06
4.7K0
腾讯云 AI 工具助力企业智能升级:场景与实践全解析
大家好,我是Echo_Wish,一个对技术充满热情的科技工作者。今天想和大家聊聊腾讯云 AI 工具在企业中的应用。随着人工智能的飞速发展,企业数字化转型的步伐也越来越快。AI 工具已经成为提升效率、优化业务的重要利器。那么,腾讯云提供的 AI 工具到底有哪些“好用绝招”?它们如何在实际场景中落地?接下来我将通过几个具体案例,带你走进腾讯云 AI 的企业实践世界。
Echo_Wish
2025/03/12
2840
腾讯云 AI 工具助力企业智能升级:场景与实践全解析
【Recorder.js+百度语音识别】全栈方案技术细节
技术栈:React+recorder-tool.js +recorder.js + Express + Baidu语音识别API
大史不说话
2018/09/10
2.6K0
【Recorder.js+百度语音识别】全栈方案技术细节
腾讯云语音识别云开发微信小程序
通过录音管理器 RecorderManager调用手机的录音功能实现音频的在线采集,通过采集到的音频的base64字符串调用云开发侧实现的腾讯云一句话识别云函数,然后将识别结果回调到小程序页面中。
张世强
2020/04/26
23.7K8
腾讯云语音识别云开发微信小程序
腾讯云智能语音小程序插件实现实时语音识别
注意:此插件需要小程序的基础库版本在>= 2.10.0,可以通过如下方式查看您当前的小程序基础库版本
张世强
2020/08/07
20K3
腾讯云智能语音小程序插件实现实时语音识别
Vue + Node.js 搭建「文件上传」管理后台
本教程手把手带领大家搭建一套通过 Vue + Node.js 上传文件的后台系统,只要你跟随本教程一步步走,一定能很好的理解整个前后端上传文件的代码逻辑。前端我们使用 Vue + Axios + Multipart 来搭建前端上传文件应用,后端我们使用 Node.js + Express + Multer 来搭建后端上传文件处理应用。
蒋川
2022/04/22
12.7K0
Vue + Node.js 搭建「文件上传」管理后台
体验腾讯云音视频
首次开通腾讯云音视频免费赠送10000分钟的免费试用套餐包,包含了视频通话、语音通话、视频互动直播、语音互动直播这些模块,另外说明一下腾讯云音视频是按照 1 : 2 : 4 : 9 : 16 : 36 分别抵扣语音、标清、高清、超高清、2K和4K时长,例如1分钟高清视频时长扣除4分钟免费套餐包时长。
就叫7620521吧
2022/11/25
8.6K0
用腾讯云 AI 录音文件识别,实现短视频字幕批量处理,1行代码搞定语音转文字
经常遇到身边的朋友,想从视频中提取出文字,尤其是自媒体博主,如果能直接把视频转换成文章,那可太省时间了。
程序员晚枫
2022/12/09
4.1K0
用腾讯云 AI 录音文件识别,实现短视频字幕批量处理,1行代码搞定语音转文字
推荐阅读
相关推荐
对象储存cos-腾讯云对象储存cos
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验