首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

深度学习系列四: SGPN

背景引入 分割概念 语义分割:对图像中每个像素或的每个都划分出对应的类别 实例分割:实例分割是物体检测+语义分割的综合体。...整体框架 首先使用PointNet/PointNet++来获取Np个的全局和局部特征,然后在特征的基础上计算三个属性矩阵相似矩阵(Similarity Matrix)、置信度矩阵(Confidence...如果两个是一个桌子、一个椅子的话,我们就让它们的距离比 K2 大,在训练的时候 K1 要比 K2 小一,在实验中我们发现用这种 double hinge loss 的方式,会让结果更好一,比 K1...SGPN中的相似矩阵的一个可视化结果,表示了一个指定点到其余的距离。红色箭头处表示的是指定点的位置,的颜色表示相似度,黑色表示你距离较近。...当聚类完成后,每一个都会属于某一个实例。但是在两个实例的相邻区域,则可能属于两个实例;本文的方案就是将该随机设置为某一个实例。

1.5K30

深度学习系列三: SPLATNet

格子单体的大小或网格之间的空间通过缩放格子特征ΔL来控制,其中Δ是缩放矩阵的对角线。 Convolve:投影到dl维网格上,BCL使用可学习的滤波器内核执行dl维卷积。...SPLATNet3D:输入首先通过一个1*1的卷积层,之后采用不同尺度的BCL层(采用了和CNN一样的思想,格子变的越来越大,感受野也更加大,提取的特征越来高层),之后将这些BCL层合并,通过两个1...2D-3D Fusion: 将投影到3D空间的特征和SPLATNet3D对处理后得到的特征融合,通过一系列的1*1的卷积层得到了每个的概率 BCL3D-2D:对于图像的分类问题我们需要将3D...3.论文的意义 将图像和结合处理,相互约束,正如PointCNN提出方向一样。 对于2D图像,利用3D特征有助于在多个视点上进行一致的预测。...对于3D,合并2D-CNN,有助于利用2D-CNN是在高分辨率图像上计算强大的特点。 THE END

1.2K40
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    深度学习系列五: RSNet

    整体框架 初始n*d的,首先经过输入特征提取块(3卷积层,每层64个1*1滤波器),输出n*din大小的特征Fin;通过x、y、z三个方向的切片池化层将无序转换为有序序列;采用双向...RNN处理序列,更新特征;采用切片上池化层映射回每个;最后经过输出特征提取块(3个1*1卷积层,输出维度为512,256,K),处理Fsu(切片上池化层的输出),输出每个的预测 ?...局部依赖模块 Slice Pooling Layer 输入是无序的特征,输出是有序的特征向量序列。从x、y、z三个方向进行切片,通过超参数r控制切片的分辨率,N为切片数。...RNN Layer 利用RNN处理局部依赖建模的序列中,因为它们是一组为结构化序列而设计的端到端学习算法。...它的输入是Fs,为了保证某一个切片可以影响到其它切片,采用双向RNN,输出是周边影响的特征Fr。 ?

    93030

    深度学习系列二: PointCNN

    对于转换后的学习到X变换矩阵,对融合后的特征变换得到FX,再采用卷积处理 四、PointCNN框架 ?...但是,我们希望保持网络的深度,同时保持感受野的增长率,使得更深层的代表“看到”整个形状的越来越大的部分。我们通过将图像CNN中的空洞卷积思想应用到PointCNN中来实现这一目标。...全卷积的PointCNN 在原本的CNN中运用了全卷积的思想来处理不同大小的图像,PointCNN也应该实现全卷积的方法来处理不同尺度的。...为了证明这一,论文中将PointCNN运用到了MNIST和CIFAR10的形式上。...目前并没有一个科学的准则判断是应该将数据表达为规则形式进而应用CNN,还是应该将数据表达为形式进而应用PointCNN。

    2.2K50

    3D深度学习

    使用卷积神经网络(CNN)架构的深度学习(DL)现在是解决图像分类任务的标准解决方法。但是将此用于处理3D数据时,问题变得更加复杂。...首先,可以使用各种结构来表示3D数据,所述结构包括: 1 体素网格 2 3 多视图 4 深度图 对于多视图和深度图的情况,该问题被转换为在多个图像上使用2D CNN解决。...但是,对于3D的情况,目前还不清楚如何应用DL工具。...http://www.cnblogs.com/li-yao7758258/p/8182846.html 以及最近山东大学研究者们提出的PointCNN,对于pointCNN 这篇论文是一种为基于的特征学习提出了一种简单且通用的框架...我们提出的方法是典型CNN向基于的特征学习的泛化,因此将其称为PointCNN。实验表明,PointCNN能在多种有挑战性的基准数据集和任务上实现与之前最佳方法媲美或更好的表现。

    1.3K30

    深度学习质量增强方法综述

    近年,基于深度学习的方法借助深度卷积神经网络强大的特征学习能力,获得了更佳的质量增强性能,受到了众多学者的广泛关注。因此,本文将对基于深度学习质量增强方法展开综述。...01 关键技术在对基于深度学习的3类质量增强方法的基本结构进行梳理归纳后,本节总结介绍了深度卷积神经网络应用于质量增强时通用的基础知识和关键算法模块。...1.2 PointNet与PointNet++随着深度学习技术的兴起,面向分析的深度卷积神经网络也迅速出现并不断发展。...现阶段基于深度学习去噪方法可根据是否采用编码器—解码器结构分为两类。...5.1 常用数据集本小节介绍在基于深度学习质量增强任务中常用的数据集,如表5所示。

    1K10

    深度学习研究现状与趋势

    PCL VS深度学习 我们都知道,在深度学习没出来之前,图像处理就已经发展出大量算法了。同样的,处理领域也是这样,比如做特征提取、配准、识别等等。...近几年深度学习发展迅速,在图片、视频和自然语言处理等领域大放异彩。最近三年在处理领域中也逐渐发展起来,下面按照处理形式对现有方法进行分类和梳理。...基于像素的深度学习 这是最早用深度学习来处理数据的方法,但是需要先把三维在不同角度渲染得到二维图像,然后借助图像处理领域成熟的深度学习框架进行分析。...基于深度学习 代表作是斯坦福大学研究人员提出的PointNet,用来直接对进行处理,该网络很好地考虑了输入的排列不变性。采用maxpooling作为对称函数进行处理。...如果走第一条路,需要对传统处理算法进行学习,而深度学习就只是提取特征的工具了,会用就行。

    1.1K40

    深度学习研究现状与趋势

    PCL VS 深度学习 我们都知道,在深度学习没出来之前,图像处理就已经发展出大量算法了。同样的,处理领域也是这样,比如做特征提取、配准、识别等等。...近几年深度学习发展迅速,在图片、视频和自然语言处理等领域大放异彩。最近三年在处理领域中也逐渐发展起来,下面按照处理形式对现有方法进行分类和梳理。...[trdt8ltl5d.png] 1 基于像素的深度学习 这是最早用深度学习来处理数据的方法,但是需要先把三维在不同角度渲染得到二维图像,然后借助图像处理领域成熟的深度学习框架进行分析。...2 基于体素的深度学习 代表作有Volumetric CNN 、VoxNet、VoxelNet。将划分成均匀的空间三维体素,对体素进行处理。...如果走第一条路,需要对传统处理算法进行学习,而深度学习就只是提取特征的工具了,会用就行。

    3.7K30

    深度网络——PointNet

    今天要聊的论文是斯坦福大学Charles等人在CVPR2017上发表的论文,提出了一种直接处理深度学习网络——PointNet。...因为在PointNet之前,没办法直接处理。 由于是三维的、无序的,别说深度神经网络了,就是普通算法很多都不能奏效。...于是人们想出来各种办法,比如把拍扁成图片(MVCNN),比如把划分成体素(类似游戏“我的世界”里的场景),再比如把划分成节点然后按顺序拉直(O-CNN)等等。...总之,先要被处理成“非”。这些想法怎么样呢?其实也挺不错的,也能取得较好的结果。比如MVCNN的有些指标就不输PointNet。...由于做的人对这篇论文肯定都比较熟悉了,这里就不按照论文顺序详细展开了,只把PointNet的几个创新简单提一提。 1 针对无序性——采用Maxpooling作为对称函数。

    1.6K20

    前沿丨基于深度学习分割网络及分割数据集

    传统的分割主要依赖聚类算法和基于随机采样一致性的分割算法,在很多技术上得到了广泛应用,但当规模不断增大时,传统的分割算法已经很难满足实际需要,这时就需要结合深度学习进行分割。...PointNet是首个输入3D输出分割结果的深度学习网络,属于开山之作,成为了后续很多工作的BaseLine,网络的总体结构如图1所示。...由于PointNet直接暴力地将所有的最大池化为一个全局特征,因此局部之间的联系并没有被网络学习到。...而基于深度学习分割网络较好地解决了上述问题,本文重点介绍了几种前沿的分割网络,包括PointNet/PointNet++、PCT、Cylinder以及JSNet网络,并介绍了5种常用的分割数据集...读者在应用深度学习进行分割或设计分割网络时,要根据自身需求和实际工况,有针对地选择合适的分割网络和数据集。 本文仅做学术分享,如有侵权,请联系删文。

    3.5K21

    深度学习系列一: PointNet和PointNet++

    前言:,本公众号将持续深度学习最近的相关文章,这个系列从CVPR2017的PointNet开始,主要总结顶会的相关文章,不会全文翻译,只总结重要的。...PointNet (PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation) (作为第一个直接处理深度学习框架...使用PointNet作为局部特征学习器作为一个基础的结构部件,PointNet要在局部集中抽取特征,或者把特征组合成更高层表示,所以PointNet++递归地使用PointNet在一个嵌套划分的输入云集合上...将插值得到的特征和之前跳跃连接的特征融合,在使用PointNet提取特征 总结 给一片,PointNet++会先对进行采样(sampling)和划分区域(grouping),在各个小区域内用基础的...投稿或联系群主邮箱:dianyunpcl@163.com 另外现有点深度学习论文共读小组开放报名,由博士组长带领组员定期交流分享!有意者可私信群主。且招募其他方向的小组组长。有意者请报名。

    4.9K41

    3D | 基于深度学习处理数据入门经典:PointNet、PointNet++

    前言 不同于图像数据在计算机中的表示通常编码了像素之间的空间关系,数据由无序的数据点构成一个集合来表示。因此,在使用图像识别任务的深度学习模型处理数据之前,需要对数据进行一些处理。...不同于以上两种方法对数据先预处理再使用的方式,PointNet系列论文提出了直接在数据上应用深度学习模型的方法。...对齐操作是通过训练一个小型的网络来得到转换矩阵,并将之和输入数据相乘来实现。Pointnet的解决方法是学习一个变换矩阵T,即T-Net结构。...5)对分类任务,将全局特征通过mlp来预测最后的分类分数;对分割任务,将全局特征和之前学习到的各的局部特征进行串联,再通过mlp得到每个数据点的分类结果。...虽然PointNet能够用于对各个局部提取特征,但是由于在各个局部均匀性不一致,很可能导致学习到的PointNet不能提取到很好的局部特征。

    9.6K42

    深度学习的3D场景理解(下)

    本文主要是关于 pointNet,pointNet++,frustum point 的一些整理和总结,内容包括如何将进行深度学习,如何设计新型的网络架构,如何将架构应用的3D场景理解。...上文请看点深度学习的3D场景理解(上) PointNet++ PointNet 缺陷 1. 对比3Dcnn3D和2D很像,只是变成了3D卷积,多级学习 不断抽象特征,平移不变性。 ?...具体的例子:多级的学习 ? ? 上面的例子说明在世界坐标系中,先找到一个局部的区域,因为不想受整体平移的影响。   ...3 对输入做归一化,因为对的归一化,可以简化学习问题,比如: ? a:俯视图,汽车的位置视锥的范围x 很大。...c:进一步,在深度上,z上有很大的分布,我们基于3D物体分割可以找到分割后的中心,物体的集中在原点附近,进一步简化。

    2K31

    学习】介绍

    激光雷达扫描仪就是一种采集传感器 正文 简单的介绍和应用,主要侧重在规则方面: 什么是?...常见的检测用采集设备 格式 01 什么是 是用各种设备仪器采集得到的数据集合 起源Original 雷达在反法西斯战争中发挥了重要作用,在英国战场雷达的出现可以说是扭转战局的关键力量...便携式采集为VR提供支持 ? 酷炫的应用场景,让我们浮想联翩。...02 工业检测中的采集设备 我们这里主要介绍在工业检测应用中使用的。 目前常见的采集设备都是垂直安装,利用XY平面进行扫描采集。 激光 ?...一些特殊的XY按规则排列,我们可以用2D的方式显示成热图 小结 1. 介绍 2. 数据

    1.8K31

    深度学习的3D场景理解(上)

    本文主要是关于 pointNet,pointNet++,frustum point 的一些整理和总结,内容包括如何将进行深度学习,如何设计新型的网络架构,如何将架构应用的3D场景理解。...三维数据本身有一定的复杂性,2D图像可以轻易的表示成矩阵,3D表达形式由应用驱动的:   point cloud ,深度传感器扫描得到的深度数据,   Mesh,三角面片在计算机图形学中渲染和建模话会很有用...Point c'loud 是一种非常适合于3D场景理解的数据,原因是:   1、是非常接近原始传感器的数据集,激光雷达扫描之后的直接就是深度传感器(深度图像)只不过是一个局部的,原始的数据可以做端到端的深度学习...之前的大部分工作都是集中在手工设计数据的 ? 这些特征都是针对特定任务,有不同的假设,新的任务很难优化特征。希望用深度学习特征学习去解 决数据的问题。   ...还要决定的投影的角度   3、云中提取手工的特征,再接FC,这么做有很大的局限性 ? PointNet  我们能否直接用一种在学习的方法:统一的框架 ? ?

    2.5K30

    第02课:深度学习 Python 必备知识

    无论是在机器学习还是深度学习中,Python 已经成为主导性的编程语言。而且,现在许多主流的深度学习框架,例如 PyTorch、TensorFlow 也都是基于 Python。...这门课主要是围绕 “理论 + 实战” 同时进行的,所以本文,我将重点介绍深度学习Python 的必备知识。...Python 具有丰富和强大的库。它常被昵称为胶水语言,能够把用其他语言制作的各种模块(尤其是 C/C++)很轻松地联结在一起。 为什么人工智能、深度学习会选择 Python 呢?...Python 实际上是实现 API 调用的功能,例如所有的深度学习框架 PyTorch、TensorFlow 等,底层都是由 C/C++ 编写的。...顺便提一下,为了加快深度学习神经网络运算速度,可以使用比 CPU 运算能力更强大的 GPU。

    1K10

    PointNet:三维分割与分类的深度学习

    本文是关于PointNet深度学习的翻译与理解,PointNet是一种直接处理的新型神经网络,它很好地体现了输入的序列不变性。...对于特定的任务,找到最佳特征组合并是不容易的 3D 数据的深度学习 3D 数据具有多种流行的表示形式,从而形成各种学习方法。...无序集的深度学习 从数据结构的角度来看,是一组无序的向量。...而大多数深度学习的作品针对像序列一样的常规输入表示(在语音和语言处理中),图像和体积(视频或 3D 数据),但在深度学习集上没有做太多工作。...问题陈述 我们设计了一个深度学习框架,直接利用无序集作为输入。

    2.3K21

    汇总|基于3D深度学习方法

    前言 三维数据通常可以用不同的格式表示,包括深度图像、、网格和体积网格。云表示作为一种常用的表示格式,在三维空间中保留了原始的几何信息,不需要任何离散化。...近年来,深度学习技术已成为计算机视觉、语音识别、自然语言处理、生物信息学等领域的研究热点,然而,三维深度学习仍然面临着数据集规模小、维数高、非结构化等诸多挑战三维。...在此基础上,本文对基于数据下的深度学习方法最新进展做了详解,内容包括三维形状分类、三维目标检测与跟踪、三维分割三大任务。 ?...3D形状识别 这些方法通常先学习每个的embedding,然后使用聚集方法从整个云中提取全局形状embedding,最后通过几个完全连接的层来实现分类。...类似于二维视觉中的光流估计,已有多种方法开始从序列中学习有用信息(如三维场景流、空间临时信息),主要包括: Flownet3D: Learning scene flowin 3D point clouds

    1K20
    领券