首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >W3C: 开发专业媒体制作应用 (3)

W3C: 开发专业媒体制作应用 (3)

作者头像
用户1324186
发布于 2022-05-24 10:27:35
发布于 2022-05-24 10:27:35
4480
举报
文章被收录于专栏:媒矿工厂媒矿工厂

来源:W3C/SMPTE Joint Workshop on Professional Media Production on the Web 演讲 1:WebAssembly Music - latency/stability across platforms 主讲人:Peter Salomonsen 演讲 2:Audio latency in browser-based DAWs 主讲人:Ulf Hammarqvist 内容整理:王秋文 在这两篇演讲中,两位主讲人都对基于 Web 浏览器的数字音频工作站进行了介绍,并讨论了这种 DAW(Digital Audio Workstation)在使用时的延迟。

目录

  • 基于 Web 浏览器的数字音频工作站介绍
  • 在线 DAW 中的延迟
  • 总结

基于 Web 浏览器的数字音频工作站介绍

类如 Soundtrap 的 DAW(Digital Audio Workstation)可以在网页浏览器上在线完成多轨音频的记录和编辑等制作过程。类似的 DAW 可以与 MIDI 键盘相连接,当音乐家通过键盘进行演奏时,DAW可以实时生成相应的 AssemblyScript 代码,从而编译为 WebAssembly。工作站内含有弦乐器、管乐器和鼓等等多种软件乐器,具有各种音频效果、混响、过滤器以及吉他AMP仿真等功能。DAW 可以提前录制好音频片段,并在播放的时候同时加入其它音频片段。在这样的 DAW 上可以完成全部音频音乐的制作过程。

图1 DAW 页面生成的代码示意图

附上演讲视频:http://mpvideo.qpic.cn/0bc3suaaqaaasaajqzllnrrfbfodbckqacaa.f10002.mp4?dis_k=3ee3606da056fad9bd3ec43cf7c3b606&dis_t=1653387988&vid=wxv_2376058434518876162&format_id=10002&support_redirect=0&mmversion=false

在线 DAW 中的延迟

在实际用例中,延迟状况对于使用者来说很重要。例如,一个吉他手可能会用在线 DAW 作为踏板或放大器等硬件设备的替代品。在演奏过程中,演奏者会在演奏的同时听到他们演奏出的效果来调整自己的表演,而这时在线 DAW 的延迟会影响相应的输出效果。诸如此类的从输入设备到输出设备的延迟可以称为 round-trip 延迟。目前在延迟方面,round-trip 延迟最好在 30ms 左右,对于监控目的来说是可用的,但并不够好。

除了延迟问题之外,在线 DAW 还存在着一个可能对于用户来说不是很明显的问题,就是用户在连续记录了几段音频并希望将它们在输出时是对齐状态的问题,我们称之为记录延迟补偿。要做到这一点听上去很简单,但实际上要做到这一点比想象的要更困难。为了实现这一点,我们需要知道音频在整个流程中的确切延迟,并知道音频数据何时到达用户的储存器或流中。

Round-trip 延迟中有很多组成部分,包括输入延迟、处理延迟和输出延迟。对于延迟补偿来说,如果我们对于音频的延迟信息是错的或者没有相关的延迟信息,那么最终处理的结果也会是不理想的。对于输入和输出部分来说,其中包含着很多组成部分,同时具体的延迟状况也与不同用户的不同设备、系统等有关,也因此有较大差别。

图2 使用在线 DAW 时音频信息整体框架图

除了进入浏览器和离开浏览器时会有延迟外,浏览器自身内部也会有延迟。假定 Media Stream Track 设置中的延迟属性可以准确表示输入路径的延迟,但 Media Stream自身作为节点,其中也可能存在缓冲或延迟,因此整体的输入延迟会有一定的差别。

与输入延迟一样,我们也需要输出延迟的数据。Web Audio属性中的 OutLatency一项可以表明输出模块的大小以及输出路径的组合,但是这个数据并不清晰。

另一个方面就是数据到达的时间,完成这一目的有很多方法,例如使用 MediaRecorder,它可以随时在运行中进行编码。但是它并不可以在你启动时就立即开始,因此也会引入一部分延迟。

对于 DAW 自身来说,在不同的系统间也会带来不同的延迟。一般来说,在 Mac 上运行只要几毫秒即可,但如果要在 Windows 系统上运行的话,延迟可能要到 10 毫秒左右。这会极大地影响使得演奏的体验。除此外,对于 Windows 系统来说,直接在电池上运行会使得音频的质量变差或是对操作产生影响。

除此外,不同的浏览器之间也会有差别,例如在 Firefox 中可以很好地引用 AudioWorklet,一个将 WebAssembly 代码绑定到 Web Audio API上的技术。但 Firefox 不支持 MIDI 键盘,因此需要寻找其他解决办法。

总结

总的来说,在网页上创作音频是一个具有很多可能性的技术,它可以替代使用本地应用程序创作音频的过程。但这一项技术仍然需要在稳定性以及延迟方面,对不同的浏览器和系统进行优化。同时,相应的输入输出驱动程序也应当显示相应的延迟信息便于各项功能的实现。

附上演讲视频:http://mpvideo.qpic.cn/0b2eeiaagaaa2eaizudllzrfaiwdamraaaya.f10002.mp4?dis_k=73ac638115af1b9ac4d650bd871a0796&dis_t=1653387988&vid=wxv_2376058117312053249&format_id=10002&support_redirect=0&mmversion=false

  1. W3C: 开发专业媒体制作应用 (1)
  2. W3C: 开发专业媒体制作应用 (2)
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-04-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 媒矿工厂 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
W3C: 媒体制作 API (2)
今天,我想谈谈最近一个叫做 WebCodecs API 的API。特别是当在 web 平台上与其他 API 一起使用此 API 时的内存访问模式。我们将讨论访问视频帧时的一些原始性能数据,WebCodes 目前为最小化内存、访问开销所做的工作,以及 API 目前存在的一些问题,其中有一个解决方案,但尚未实现。更重要的是,我们将在未来解决两个更难的问题,这样使用 WebCodec 将具有与本地应用相同的性能。
用户1324186
2022/05/25
1.1K0
W3C: 媒体制作 API (2)
W3C:开发专业媒体制作应用(6)
James Pearce 首先展示了基于 web 的视频编辑器。它遵循了编辑应用程序的普通的三窗口布局。在左上角有一个源视频查看器,用于加载视频源,然后将它们剪辑并添加到时间线中。在底部有一个时间轴,用以展示了各种轨迹,以及这些轨迹中的片段。在右上角有一个序列播放器,它可以播放正在构建的时间轴。最左边是所有视频源的列表,可以找到一个源,并将其加载到源查看器中,或者直接将其拖放到时间线中。
用户1324186
2022/05/24
1K0
W3C:开发专业媒体制作应用(6)
W3C: 媒体制作 API (3)
来自 WebCodecs 的技术主管 Chris Cunningham 将首先介绍一些 WebCodecs 的 API,并会介绍一些关于视频编码器的设置。
用户1324186
2022/05/25
1.1K0
W3C: 媒体制作 API (3)
W3C: 开发专业媒体制作应用 (2)
演讲中主要介绍了 clipchamp 在使用 WebCodecs 方面的工作。clipchamp 是一个完全基于浏览器的视频编辑器,能够带来云服务的便捷性以及桌面应用级的响应速度。
用户1324186
2022/05/24
1.3K0
W3C: 开发专业媒体制作应用 (2)
W3C: 开发专业媒体制作应用 (5)
创作者习惯于触手可及的桌面级硬件的全部功能。我们如何构建具有相同水平的性能和表现力的应用程序,同时又具有基于 Web 的体验的所有好处?
用户1324186
2022/05/24
4030
W3C: 开发专业媒体制作应用 (5)
W3C: 开发专业媒体制作应用 (1)
当我被要求为这次研讨会准备演讲时,我认为这是一个向世界表达我们愿望的绝佳机会。因此,我要求我的同事帮助我准备一份清单,其中包含我们希望在某个时候实施或我们已经实施但如果可能的话真正希望以更好的方式实施的东西。
用户1324186
2022/05/24
9900
W3C: 开发专业媒体制作应用 (1)
W3C: 媒体制作 API (1)
由于 webRTC 不是端到端而是点对点技术和多方会议是主要用例,广播行业对它的看法从来都不是很好;也没有被视为流媒体的可行解决方案,因为它无法扩展,且难以使用。传统的流媒体行业主要由 Netflix 或 Hulu 等为代表的视频点播模式主导。然而,新冠病毒的大规模传播改变了这一切,它加速了实时媒体工作流程的采用,最终弥合了网络和广播之间的差距。
用户1324186
2022/04/11
1.3K0
W3C: 媒体制作 API (1)
W3C:开发专业媒体制作应用(4)
在以前,把团队召集在同一个房间同一块屏幕下协同工作毫不费力,但是随着远程工作的大流行,现有协同工作软件,例如网络会议,内容分享工具,不足以满足高自由度媒体内容创作团队的需求,例如艺术创作,动画创作,视频创作等。我们在 Bluescape 创造了一种新颖的方法,使得几乎任何网站或启用网络的工具都可以获得额外的功能,以便在查看、评论和编辑媒体内容时获得实时共同体验。当用户或团队开启共同会话时,被使用的的网站会加载到云中,同时将相同的副本和所有新增的更改广播到所有连接的客户端,为它们提供相同的质量、相同的延迟和大致相同体验,就像他们在本地设备上或在同一屏幕后面浏览内容一样。
用户1324186
2022/05/24
1.5K0
W3C:开发专业媒体制作应用(4)
W3C: 媒体工作流集成 (1)
本次分享的主持人为来自 W3C/SMPTE 网络专业媒体制作联合研讨会主席 Pierre-Anthony Lemieux,他向我们分享了最新的网络浏览器发展,现在在任何网络浏览器中使用专业媒体已经成为可能,并且实际上可以在 HTTP 服务器上播放无损的 UHD 视频,无需代码和插件。
用户1324186
2022/04/11
5150
W3C: 媒体工作流集成 (1)
Audio Orchestrator:使用多设备编排沉浸式互动音频
设备编排指的是使用多个同步的设备协同播放以增强媒体的体验效果。如今,大多数家庭中都有多个可联网的媒体设备,但使用这些设备进行同步工作并提高交互性和沉浸性的相关工作却较少。在这一方面,过去的工作探索了基于对象的音频和同步的多屏幕内容,并对音频编排进行了一定的试验。为了对音频编排的相关用例进行快速探索, BBC R&D 生产了工具 Audio Orchestrator ,并与许多合作伙伴进行了公开实验。
用户1324186
2022/02/18
9100
Audio Orchestrator:使用多设备编排沉浸式互动音频
用于 6-DoF 视听内容捕获和制作的工具
虽然该灵活的制片过程主要针对XR应用,因为捕获的6自由度素材可以在给定的运动范围内,并且从任何角度查看。但与此同时,它也可以被用于传统的常规制片流程,只需要在虚拟视角下对所捕获的内容进行框选即可。
用户1324186
2022/04/11
9680
用于 6-DoF 视听内容捕获和制作的工具
JPEG 和 RIST 更新
JPEG XS 活动组最近一直致力于 JPEG XS 互操作性文件交换以及 TR-07 和 TR-08 的审查和修订。本次演讲主要就针对了这些更新内容。
用户1324186
2022/05/25
7750
W3C:媒体工作流集成(2)
目前的工作流程范式有两个主要问题。第一个问题是,每个集成在平台中的系统,或者两个需要集成的系统,都需要知道对方的 API。这有一个问题,就是它很难进行迭代。如果我们改变了一个系统的 API,就会影响到所有与之集成的其他系统。第二个问题是,我们需要在工作流程中增加非具体的业务步骤。例如,将一个媒体移动到另一个地方,或对来自一个系统的信息进行转换。而且,这也使得解决方案和工作流程难以发展和维护。
用户1324186
2022/05/25
5820
W3C:媒体工作流集成(2)
Image Line FL Studio v21.0.3.3517 Producer版全插件版WIN免费下载完整版
原文链接:https://blog.csdn.net/tubage2023/article/details/132130229
用户10542704
2023/08/06
4000
Image Line FL Studio v21.0.3.3517 Producer版全插件版WIN免费下载完整版
WebRTC 教程(1)
WebRTC: Web Real Time Communication 是一系列为提供端到端实时通信连接的协议和 API。Google 于 2011 年发布了基于浏览器的 WebRTC 项目,且这个技术可以使很多不同的应用,如视频会议、文件传输、聊天和桌面共享等都不需要额外的插件。
用户1324186
2022/04/11
2.2K0
WebRTC 教程(1)
AV1编码现状(2022.1)
此前业内认为,AV1 虽然是性能较佳的编码器,但由于其生态尚不完备,因此实用性有待考量。但事实上,在 2022 年的现在看来,AV1 已经显示了一定的部署和应用前景:
用户1324186
2022/04/11
5.5K0
AV1编码现状(2022.1)
FL Studio2023完整版水果编曲数字音频工作站(DAW)
Image-Line宣布针对Win和Mac版本的数字音频工作站FL Studio的21版本更新。FL Studio2023是一个完整的软件音乐制作环境或数字音频工作站(DAW)。代表超过 23年的创新发展,它包含了您在一个包装中编排,编排,录制,编辑,混音和掌握专业品质音乐所需的一切。FL Studio 现在是世界上最受欢迎的 DAW 之一,并被最具创意的艺术家所使用。即使你不是一位制作人,你也肯定听说过 FL Studio 或是“水果”的大名。在各大编曲宿主如 Live,Logic,Cubase 等实用软件竞争的今天,FL 能从它们中脱颖而出,成为最受欢迎的 Daw 之一是有原因的,其上手快、自带插件适合舞曲制作的特性让电音制作人们爱不释手,像 Avicii,Martin Garrix,Jay Hardway,Blasterjaxx,Maddix 等大师都(曾经)在用 FL Studio 制作音乐!
用户7442547
2022/11/26
8270
WebRTC 的未来
IETF 首先做的工作是开发了 NICER。NICER 是一种在一次对话中切换 4G 和 wifi 的一种方法,这给 WebRTC 增加了一个新功能。
用户1324186
2022/05/25
1.3K0
WebRTC 的未来
如何监控流服务
本文来自 Berlin Video Tech 的演讲“How to monitor a streaming service”,演讲者是 AVEQ 公司的 CEO Werner Robitza 和 CTO Alexander Dethof。CEO 首先介绍了 AVEQ 公司的情况,该公司的目标之一就是衡量流媒体的质量,让用户安心推送流媒体服务,具体体现在三个方面,即:
用户1324186
2021/12/02
7050
如何监控流服务
后话:安卓音频延迟带来的应用
有许多对音频延迟要求严格的应用程序,比如游戏、MIDI、DAW(数字音频工作站)、交互式音频应用程序,以及当前火热的虚拟现实应用。这类应用在Apple平台上蓬勃发展,并且为IOS开发者带来了巨额收益,但是这在Android平台上基本不存在。
阿利民
2022/05/16
9740
后话:安卓音频延迟带来的应用
相关推荐
W3C: 媒体制作 API (2)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档