音频、视频是将客观的、大自然中的声音和画面尽量的捕捉出来,然后通过眼睛和耳朵输入在人脑里,实现主观的呈现。
作为人类对大自然的捕捉,它永远是只能无限逼近真实,而无法达到与现实百分百相同,这就是人类的局限性,这也是人类使用工具的局限性。
目前使用最顶级的设备将自然界中的声音和图像保存下来这个数量级是巨大的,比如采集一段声音它的完整细节可能达到5-100000Hz的频率甚至更多,而人耳能听到的范围是20-20000Hz,所以当人们在录音棚做成音乐的时候就把其余的频率从技术上省略掉了,然后才能达到一首歌3-5MB大小的效果。
视频的最小颗粒是像素点,摄像机拍摄一张照片,如何体现它的画面的清晰度就参考这个指标。一张4K照片,它的分辨率是3840x2160,共计8294400个点;而一张2K照片,它的分辨率是1920x1080,共计2073600个点。所以4K的清晰度是它的四倍。
声音体现在数据上是其频率范围的大小;图像和视频体现在数据上是其分辨率的大小。当人们把自然界原生的东西,转化成数字数据之后,编解码等一系列后续操作就开始了···
人们从自然界中收获到一段音视频画面,他不仅仅想在本地自己欣赏,还想把这一段影音分享给远方的亲朋,这时就涉及到一个传输的问题。网络就像管道,数据就像水,目前遇到的最大问题是吞吐量不够大,2G、4G、5G就是在解决这个问题,水流量越来越大了,水流速度越来越快了···世界各地的人们在网络的管道里,拍摄和分享着自己的一条音视频。
有时在一些正式的机构会议,影音画面的传输还可能需要速度快、低延迟、高清晰的特点,来保证与会人员的正常沟通。所以技术公司在这中间又做了技术处理,让音视频出发时的数据包足够小,来保证网络流量中传递的速度,抵达目的地后,在将数据包还原成原始的大小,还要保证过程中的不失真。这就是编解码技术,开头时是编码,结束时是解码。
自然的声音画面,从产生到人们看到和使用,再到电子数码产品中呈现的样子就是这个过程。
容易视听——优质、纯净、简洁的「轻量视听知识内容平台」
持续发布投影机、显示屏、音响、耳机、家庭影院、无线同屏、控制设备、视频会议等内容,在这里,你可能看到技术、原理、常识、应用、功能、方案、资讯,也可能看到品牌故事、科普知识、技术分析、产品展示、消费指南、人工智能、物联网、活动现场等。
领取专属 10元无门槛券
私享最新 技术干货