Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >直播系统开发中视频采集的技术分析

直播系统开发中视频采集的技术分析

原创
作者头像
布谷安妮
修改于 2019-09-23 07:46:04
修改于 2019-09-23 07:46:04
1.1K0
举报
文章被收录于专栏:布谷科技布谷科技

采集是整个视频推流过程中的第一个环节,它从系统的采集设备中获取原始视频数据,将其输出到下一个环节。直播系统开发中视频的采集涉及两方面数据的采集:音频采集和图像采集,它们分别对应两种完全不同的输入源和数据格式。

采集内容:

1、音频采集

音频数据既能与图像结合组合成视频数据,也能以纯音频的方式采集播放,后者在很多成熟的应用场景如在线电台和语音电台等起着非常重要的作用。音频的采集过程主要通过设备将环境中的模拟信号采集成 PCM 编码的原始数据,然后编码压缩成 MP3 等格式的数据分发出去。常见的音频压缩格式有:MP3,AAC,OGG,WMA,Opus,FLAC,APE,m4a 和 AMR 等。

在音频采集阶段,参考的主要技术参数有 :

采样率(samplerate):

采样就是把模拟信号数字化的过程,采样频率越高,记录这一段音频信号所用的数据量就越大,同时音频质量也就越高;

位宽:

每一个采样点都需要用一个数值来表示大小,这个数值的数据类型大小可以是:4bit、8bit、16bit、32bit 等等,位数越多,表示得就越精细,声音质量自然就越好,而数据量也会成倍增大。我们在音频采样过程中常用的位宽是 8bit 或者 16bit;

声道数(channels):

由于音频的采集和播放是可以叠加的,因此,可以同时从多个音频源采集声音,并分别输出到不同的扬声器,故声道数一般表示声音录制时的音源数量或回放时相应的扬声器数量。声道数为 1 和 2 分别称为单声道和双声道,是比较常见的声道参数;

音频帧(frame):

音频跟视频很不一样,视频每一帧就是一张图像,而从上面的正玄波可以看出,音频数据是流式的,本身没有明确的一帧帧的概念,在实际的应用中,为了音频算法处理/传输的方便,一般约定俗成取 2.5ms~60ms 为单位的数据量为一帧音频。这个时间被称之为“采样时间”,其长度没有特别的标准,它是根据编解码器和具体应用的需求来决定的;

2、图像采集

图像采集的图片结果组合成一组连续播放的动画,即构成视频中可肉眼观看的内容。图像的采集过程主要由摄像头等设备拍摄成 YUV 编码的原始数据,然后经过编码压缩成 H.264 等格式的数据分发出去。常见的视频封装格式有:MP4、3GP、AVI、MKV、WMV、MPG、VOB、FLV、SWF、MOV、RMVB 和 WebM 等。

在图像采集阶段,参考的主要技术参数有:

图像传输格式:

通用影像传输格式(Common Intermediate Format)是视讯会议(video conference)中常使用的影像传输格式;

图像格式:

通常采用 YUV 格式存储原始数据信息,其中包含用 8 位表示的黑白图像灰度值,以及可由 RGB 三种色彩组合成的彩色图像;

传输通道:

正常情况下视频的拍摄只需 1 路通道,随着 VR 和 AR 技术的日渐成熟,为了拍摄一个完整的 360° 视频,可能需要通过不同角度拍摄,然后经过多通道传输后合成;

分辨率:

随着设备屏幕尺寸的日益增多,视频采集过程中原始视频分辨率起着越来越重要的作用,后续处理环节中使用的所有视频分辨率的定义都以原始视频分辨率为基础。视频采集卡能支持的最大点阵反映了其分辨率的性能;

采样频率:

采样频率反映了采集卡处理图像的速度和能力。在进行高度图像采集时,需要注意采集卡的采样频率是否满足要求。采样率越高,图像质量越高,同时保存这些图像信息的数据量也越大。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
视频直播技术详解之采集[通俗易懂]
随着互联网用户消费内容和交互方式的升级,支撑这些内容和交互方式的基础设施也正在悄悄发生变革。手机设备拍摄视频能力和网络的升级催生了大家对视频直播领域的关注,吸引了很多互联网创业者或者成熟企业进入该领域。
全栈程序员站长
2022/09/15
1.8K0
视频直播技术详解之采集[通俗易懂]
音视频八股文(1)--音视频基础
语单词“元素element”,就得到了“pixel”,简称px,所以“像素”有“图像元素”
福大大架构师每日一题
2023/04/16
9820
音视频八股文(1)--音视频基础
(强烈推荐)移动端音视频从零到上手(上)
音视频的发展正在向各个行业不断扩展,从教育的远程授课,交通的人脸识别,医疗的远程就医等等,音视频方向已经占据一个相当重要的位置,而音视频真正入门的文章又少之甚少,一个刚毕业小白可能很难切入理解,因为音视频中涉及大量理论知识,而代码的书写需要结合这些理论,所以搞懂音视频,编解码等理论知识至关重要.本人也是从实习开始接触音视频项目,看过很多人的文章,在这里总结一个通俗易懂的文章,让更多准备学习音视频的同学更快入门。
音视频开发进阶
2019/07/31
1.1K0
(强烈推荐)移动端音视频从零到上手(上)
音视频&流媒体的原理以及基础入门知识
当下,音视频、流媒体已经无处不在,直播已经火了几年,在后续的时间里面,人们聊天已经不仅仅满足与文字、而是更多的在于“类面对面”交流,能够实时感知对方的表情、动作。为此,有必要跟紧时代潮流,好好梳理梳理流媒体这门功课。
嵌入式音视频
2022/09/24
1.8K0
音视频&流媒体的原理以及基础入门知识
音视频八股文(1)--音视频基础
语单词“元素element”,就得到了“pixel”,简称px,所以“像素”有“图像元素”
福大大架构师每日一题
2023/06/08
1.1K0
音视频八股文(1)--音视频基础
(强烈推荐)移动端音视频从零到上手
音视频的发展正在向各个行业不断扩展,从教育的远程授课,交通的人脸识别,医疗的远程就医等等,音视频方向已经占据一个相当重要的位置,而音视频真正入门的文章又少之甚少,一个刚毕业小白可能很难切入理解,因为音视频中涉及大量理论知识,而代码的书写需要结合这些理论,所以搞懂音视频,编解码等理论知识至关重要.本人也是从实习开始接触音视频项目,看过很多人的文章,在这里总结一个通俗易懂的文章,让更多准备学习音视频的同学更快入门。
做个快乐的码农
2021/12/12
1.2K0
(强烈推荐)移动端音视频从零到上手
直播过程是如何实现的?带你探索直播系统源码的奥秘
自从2013年4G元年以来,移动端的直播行业依靠4G技术的支持蓬勃发展,随着技术瓶颈的突破,直播行业逐渐成为全民娱乐的一种形式,移动直播端的飞速发展促进了直播系统源码的不断开发和更新,如今进入全民直播的时代,很多人还不了解直播系统源码是如何开发的,直播过程究竟是如何实现的。本文就来为大家揭秘直播究竟是怎样呈现到大家面前的。
云豹kj的晨曦
2020/07/22
8520
直播过程是如何实现的?带你探索直播系统源码的奥秘
TRTC Android端开发接入学习之音视频基础(一)
是人对视觉感知的物质再现。三维自然场景的对象包括:深度,纹理和亮度信息。二维图像:纹理和亮度信息。
腾讯云-hongyang
2020/08/31
1.3K0
TRTC Android端开发接入学习之音视频基础(一)
音视频技术基础(一)--音视频技术概念基础
各位大佬好,我是一个刚入坑的小菜鸡,黑眼圈云豆。最近开始学习TRTC实时音视频技术,我会记录并分享我的一些学习心得和体会,欢迎各位大佬来一起交流指正。
黑眼圈云豆
2020/06/16
5.4K0
音视频技术基础(一)--音视频技术概念基础
音视频必知会(一)
随着通信技术的不断发展,互联网信息的传播与娱乐方式经历了从文字到图片再到音视频的转变,音视频通信,直播互动,短视频等应用百花齐放,特别是5G时代的到来,互联网对音视频开发者的需求会越来也大,有兴趣的同学可以把握机遇,提升自己,加入到这个行业当中。
PengJie
2021/01/03
1.5K0
Android FFmpeg系列02--音视频基础
软编(解)的时候CPU负载重,性能比硬编(解)低,但是通用性更好;硬编(解)性能高但是兼容性问题比较突出,特别是在Android平台,碎片化严重,MediaCodec的坑也是不少
雪月清
2022/09/08
1.1K0
音频基础知识
现实生活中,我们听到的声音都是时间连续的,我们称为这种信号叫模拟信号。模拟信号需要进行数字化以后才能在计算机中使用。
为为为什么
2023/05/18
1.7K0
音频基础知识
音视频基本概念:分辨率、帧速率、码流、采样位深、采样率、比特率
显示分辨率(屏幕分辨率)是屏幕图像的精密度,是指显示器所能显示的像素有多少。由于屏幕上的点、线和面都是由像素组成的,显示器可显示的像素越多,画面就越精细,同样的屏幕区域内能显示的信息也越多,所以分辨率是个非常重要的性能指标之一。可以把整个图像想象成是一个大型的棋盘,而分辨率的表示方式就是所有经线和纬线交叉点的数目。显示分辨率一定的情况下,显示屏越小图像越清晰,反之,显示屏大小固定时,显示分辨率越高图像越清晰。图像分辨率则是单位英寸中所包含的像素点数,其定义更趋近于分辨率本身的定义。常见的分辨率(ps:图片中的分辨率长宽反过来理解下,没找到好的图,如4k:4096x2160)如下:
ccf19881030
2020/10/26
3.9K0
音视频基本概念:分辨率、帧速率、码流、采样位深、采样率、比特率
菜鸟也能懂的 - 音视频基础知识
1,光和颜色光是一种肉眼可以看见(接受)的电磁波(可见光谱)。在科学上的定义,光有时候是指所有的电磁波。光是由一种称为光子的基本粒子组成。具有粒子性与波动性,或称为波粒二象性。人类肉眼所能看到的可见光只是整个电磁波谱的一部分。电磁波之可见光谱范围大约为 390~760nm(1nm=10-9m=0.000000001m)。
入门笔记
2023/03/08
9820
菜鸟也能懂的 - 音视频基础知识
科普常识:常见音频参数解析
        如果在计算机加上相应的音频卡—就是我们经常说的声卡,我们可以把所有的声音录制下来,声音的声学特性如音的高低等都可以用计算机硬盘文件的方式储存下来。反过来,我们也可以把储存下来的音频文件用一定的音频程序播放,还原以前录下的声音。
朵朵花儿
2019/12/28
3K0
iOS 音视频接入-音视频基础
今天又是一个阳光明媚的日子,我正在努力的coding,突然间项目主管来到跟前和我说,我们准备做一个直播项目。
小明同学接音视频
2020/09/27
2.2K0
流媒体音视频参数概念及详解
分辨率是和图像相关的一个重要概念,它是衡量图像细节表现力的技术参数。分辨率高是保证彩色显示器清晰度的重要前提。分辨率是体现屏幕图像的精密度,是指显示器所能显示的点数的多少。通常,“分辨率”被表示成每一个方向上的像素数量,分辨率越高,可显示的点数越多,画面就越精细。
zhangdd
2018/08/01
1.4K0
流媒体音视频参数概念及详解
音视频基础
采样精度(采样深度):每个“样本点”的大小, 常用的大小为8bit, 16bit,24bit。
vitofliu
2021/07/05
2.5K0
音视频入门基础理论知识
视频(Video) 泛指将一系列静态影像以电信号的方式加以捕捉、 纪录、 处理、 储存、 传送与重现的各种技术。
Gnep@97
2023/09/01
5670
音视频入门基础理论知识
音视频技术助力政府采购之音视频编码采集
2020 年出现新冠疫情,面对复杂严峻的新冠肺炎疫情防控形势,为做好新型冠状病毒感染肺炎的疫情防控工作,有效减少人员聚集,保障相关人员的生命安全和身体健康,财政部印发了《关于疫情防控期间开展政府采购活动有关事项的通知》(财办库〔2020〕29 号),明确在疫情期间应尽量通过电子化方式实施采购。
政采云前端团队
2023/09/01
2740
音视频技术助力政府采购之音视频编码采集
相关推荐
视频直播技术详解之采集[通俗易懂]
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档