Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >基于神经网络的联合信源信道编码

基于神经网络的联合信源信道编码

作者头像
用户1324186
发布于 2019-12-06 04:42:45
发布于 2019-12-06 04:42:45
1K0
举报
文章被收录于专栏:媒矿工厂媒矿工厂

本文是来自Stanford Compression Workshop 2019的演讲,演讲者是来自斯坦福大学的Kristy Choi。本次演讲主要讲述将深层生成模型用于自动编解码,通过端到端的方式去学习图像编解码来提升位长效率。

Kristy首先指出,在图像编码传输方面,没有信道噪声的情况下使用压缩方案简洁地编码就可以实现低重构误差。但在存在噪声的情况下,通常需要更长的消息对信息进行冗余编码才能从错误中恢复,例如添加奇偶校验位等纠错码。在给定的位长下,如何平衡用于压缩的位数与用于纠错的位数是一个复杂的问题。

针对这种情况,演讲者提出了一个通过深层生成神经网络来进行错误校正的网络框架(NECST),用于学习在给定位长的情况下对输入图像进行的压缩与错误校正。该框架主要有三个关键步骤:首先,使用神经网络将每个图像编码为合适的位字符串,深度生成模型可以提取图片特征自动编码,从而避免依赖手动的编码方案。其次,在模型中模拟离散通道,将噪声直接注入到码流中训练来增强模型的鲁棒性。第三,分摊解码过程,采用无偏差低方差梯度估计的技术,以便在训练后获得非常快速的解码器。

最后,实验结果表明,与WebP+LDPC的组合相比,NECST拥有更高的位长效率,并且随着通道噪声水平的增加,差异变得更加明显。在速度上,GPU上的NECST比传统纠错码LDPC有两个数量级的提升。

本篇的具体模型设计与解码分摊算法演讲者并未详细叙述,感兴趣的读者可以在演讲者KristyChoi的论文“Neural Joint Source-Channel Coding”中做进一步的了解。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-11-24,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 媒矿工厂 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
下一代图像压缩技术:JPEG XL
本次来自SPIE Digital Library,演讲主题是JPEG XL,下一代图像压缩技术,演讲者是来自Google Research的Luca Versari,介绍了JPEG XL的一些主要编码工具的升级。
用户1324186
2020/07/24
4.9K0
下一代图像压缩技术:JPEG XL
用神经网络重新审视 VVC 的 SAO 环路滤器
Philippe 首先介绍道,在最近的视频编解码器中,环路后处理滤波已经成为一种至关重要的组件。它可以减少压缩伪影,并减少与原始样本的失真。AVC 首先引入了去块滤波器,之后 HEVC 额外引入了 Sample Adaptive Offset 后处理滤波器,以减少振铃效应和颜色偏差。最近发布的 VVC 标准设计了一种自适应的环路滤波器,使用基于维那滤波器的自适应滤波系数,来最小化重建像素和原始像素之间的 MSE。
用户1324186
2022/02/18
9080
用神经网络重新审视 VVC 的 SAO 环路滤器
​三合一检测器 | 通过CLIP编码,实现多模态检测,解决AIGC 恶意伪造内容问题!
最近,扩散模型在图像生成领域迅速发展。以文本图像生成为代表的AI生成技术显著降低了合成图像创作的门槛。不幸的是,这种能力有可能被滥用于恶意目的。例如,文本图像生成可以用于零样本场景中,针对全球知名政治行人制作深度伪造攻击[1]。这种滥用可能会在社会结构中产生严重的信任问题。扩散生成机制与之前的做法不同,现有的检测方法在其可迁移性方面表现不佳。因此,开发针对扩散模型的伪造检测方法具有重要意义。
AIGC 先锋科技
2024/07/08
5410
​三合一检测器 | 通过CLIP编码,实现多模态检测,解决AIGC 恶意伪造内容问题!
NeurIPS 2023 | 神经网络图像压缩:泛化、鲁棒性和谱偏
目前,神经图像压缩(NIC)在分布内(in-distribution, IND)数据的 RD 性能和运行开销表现出了卓越的性能。然而,研究神经图像压缩方法在分布外(out-of-distribution, OOD)数据的鲁棒性和泛化性能方面的工作有限。本文的工作就是围绕以下关键问题展开的:
用户1324186
2024/01/04
5360
NeurIPS 2023 | 神经网络图像压缩:泛化、鲁棒性和谱偏
用扩散模型生成神经网络?NUS 尤洋团队:这不是开玩笑
由新加坡国立大学尤洋团队、加州大学伯克利分校以及Meta AI Research联手发布的一项名为“Neural Network Diffusion”的研究,已经实现了利用扩散模型来生成神经网络,这意味着扩散模型不再局限于生成表面的产品或物体结构,而是直接进行底层革新,开始拿神经网络做文章了,颇有种用魔法来打败魔法的意味。
AI科技评论
2024/02/27
3520
用扩散模型生成神经网络?NUS 尤洋团队:这不是开玩笑
ICCV 2023 | COOL-CHIC: 基于坐标的低复杂度分层图像编码器
为了使得方法的介绍更清晰,本节将简要分析隐式神经编码与以往端到端编码在训练过程以及传输码流部分的区别。
用户1324186
2023/12/28
7610
ICCV 2023 | COOL-CHIC: 基于坐标的低复杂度分层图像编码器
走进深度生成模型:变分自动编码器(VAE)和生成对抗网络(GAN)
【导读】近日,深度学习爱好者Prakash Pandey发布一篇博文介绍深度生成模型。我们知道,有监督学习在很多方面都达到了很好的效果,但是,由于有监督学习由于数据集太少等缺点,研究者逐渐偏向于探索无
WZEARW
2018/04/13
5.2K0
走进深度生成模型:变分自动编码器(VAE)和生成对抗网络(GAN)
一个神经网络实现4大图像任务,GitHub已开源
本文构建了一个能同时完成四个任务的的深度神经网络: 生成图像描述、生成相似单词、以图搜图和根据描述搜图。传统上这些任务分别需要一个模型,但我们现在要用一个模型来完成所有这些任务。
IT派
2019/06/10
1.2K0
一个神经网络实现4大图像任务,GitHub已开源
5g的控制信道编码方式_5gnr上行支持的信道编码
本章节内容的作用在于:从宏观感受物理层信道编码在整个物理层协议栈中的位置和作用,无需深究每个环节。主体内容从第2章节开始。
全栈程序员站长
2022/11/17
1.8K0
5g的控制信道编码方式_5gnr上行支持的信道编码
基于神经网络的图像压缩技术
(本文由软件工程师 Nick Johnston 和 David Minnen 发布)
花落花飞去
2018/01/31
3.4K0
基于神经网络的图像压缩技术
新编码器前景:VVC、EVC、HEVC、LCEVC、AVC等
本文来自SMPTE Technology Webcast Series,演讲者是来自Dolby laboratories, Inc的Sean T. McCarthy和Walt Husak,演讲主题是新型视频编解码器前景:VVC, EVC, HEVC,LC-EVC, AVC等。
用户1324186
2020/09/23
2.9K0
现场 | 上海纽约大学青年学者论坛:五大单元探究AI前沿
机器之心报道 作者:邱陆陆 12 月 20 日一早,上海纽约大学 15 层能够容纳 200 人的大教室里座无虚席,一场为期两天的人工智能论坛即将在这里展开。眼下的人工智能有烈火烹油、鲜花着锦之盛,如此
机器之心
2018/05/11
8630
ICLR 2024 | 针对深度视频压缩的神经网络码率控制
近年来,视频内容几乎占据了所有互联网流量的80%。因此,为视频存储和传输设计高效的视频压缩方法至关重要。传统的视频编码标准,如 AVC, HEVC 和 VVC 等,都是在过去几十年中基于块分割、线性离散余弦变换(DCT)等手工设计模块搭建的。最近,研究者对基于深度学习的视频压缩方法越来越感兴趣。现有方法通常采用深度神经网络实现运动补偿和残差/条件编码,并优化端到端压缩框架中的所有模块,展现出了有希望的结果。
用户1324186
2024/02/21
1.4K0
ICLR 2024 | 针对深度视频压缩的神经网络码率控制
神经网络主要类型及其应用
目前深度学习中的神经网络种类繁多,用途各异。由于这个分支在指数增长,跟踪神经网络的不同拓扑有助于更深刻的理解。在本文中,我们将展示神经网络中最常用的拓扑结构。
McGL
2020/09/02
2.4K0
Netflix:用神经网络改善视频质量
作者:Christos G. Bampis,Li-Heng Chen and Zhi Li
LiveVideoStack
2023/01/10
6900
Netflix:用神经网络改善视频质量
业界 | 华为AI芯片+微软研发=第一款移动端离线推理神经网络
机器之心原创 作者:邱陆陆 10 月下旬,华为的 NPU AI 专用处理单元和 HiAI 移动计算平台亮相华为上海发布会,引起了诸多关注。在发布会上,余承东通过微软为华为开发的 Microsoft T
机器之心
2018/05/10
1.1K0
Microchip:基于ML算法延长NAND寿命
随着NAND技术的进步,有效的NAND管理变得越来越具有挑战性。具体来说,有以下几点:
数据存储前沿技术
2025/02/11
1450
Microchip:基于ML算法延长NAND寿命
Reparo: 用于视频会议的无损生成编解码器
视频会议中常常受到网络丢包的影响,导致视频质量下降甚至视频冻结。传统解决方案如重传丢失的数据包在实时应用中往往不切实际。采用前向纠错(FEC)技术恢复丢失的包具有挑战性,因为很难设定合适的冗余度。
用户1324186
2024/03/20
3020
Reparo: 用于视频会议的无损生成编解码器
卷积神经网络一些问题总结
涉及问题: 1.每个图如何卷积: (1)一个图如何变成几个? (2)卷积核如何选择? 2.节点之间如何连接? 3.S2-C3如何进行分配? 4.16-120全连接如何连接? 5.最后output输出什么形式? ①各个层解释: 我们先要明确一点:每个层有多个Feature Map,每个Feature Map通过一种卷积滤波器提取输入的一种特征,然后每个Feature Map有多个神经元。 C1层是一个卷积层(为什么是卷积?卷积运算一个重要的特点就是,通过卷积运算,可以使原信号特征增强,并且降低
用户1737318
2018/06/05
9080
利用JPEG制作更快,更准确的神经网络
文 / Lionel Gueguen, Alex Sergeev, Rosanne Liu, & Jason Yosinski
LiveVideoStack
2021/09/01
5690
推荐阅读
相关推荐
下一代图像压缩技术:JPEG XL
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档