深度学习很难。 虽然通用逼近定理表明足够复杂的神经网络原则上可以逼近“任何东西”,但不能保证我们可以找到好的模型。
DE-9IM 是Dimensionally Extended 9-Intersection Model 的缩写,DE-9IM 模型是用于描述两个 二维几何对象(点、线、面) 之间的空间关系的一种模型,它使用一个 3 x 3 的矩阵来描述几何关系类别(相交部分的维度)。
选自Keras Blog 作者:Francois Chollet 机器之心编译 参与:路雪、李泽南 在人工智能,特别是深度学习破解了一个又一个难题,在很多任务上达到超过人类认知水平的今天,我们距离真正的人工智能仍很遥远。本文摘自作者出版的新书《Deep Learning with Python》第九章第二节,其中简要介绍了深度学习的原理、强大能力、以及无处不在的局限性。 深度学习:几何视角 关于深度学习最令人吃惊的事实莫过于它的简单程度。10 年前,没人想到我们会使用简单的梯度下降参数模型在机器认知领域取得
深度学习:几何视图 深度学习最令人惊讶的特点便是极易上手。十年以前,没有人可以猜得到经过梯度下降法训练过的简单参数模型可以在机器感知问题上实现如此惊人的结果。现在,事实证明,研究者所需要做的只是使用足够大的梯度下降素材来训练参数模型。正如 Feynman 曾经描述宇宙一样,“它并不复杂,只是里面包含的东西实在太多。” 在深度学习中,所有的东西都是一个向量(任何的东西都是几何空间中的一个点)。模型的输入(可能是文字,图片,等等)和目标首先被向量化(变成了一些初始输入向量空间和目标向量空间)。深度学习模型中的每
作者 | Francois Chollet 编译 | 聂震坤 深度学习:几何视图 深度学习最令人惊讶的特点便是极易上手。十年以前,没有人可以猜得到经过梯度下降法训练过的简单参数模型可以在机器感知问题上实现如此惊人的结果。现在,事实证明,研究者所需要做的只是使用足够大的梯度下降素材来训练参数模型。正如 Feynman 曾经描述宇宙一样,“它并不复杂,只是里面包含的东西实在太多。” 在深度学习中,所有的东西都是一个向量(任何的东西都是几何空间中的一个点)。模型的输入(可能是文字,图片,等等)和目标首先被向量化
最近的工作开始探索稀疏视图新视图合成,特别是专注于从有限数量的具有已知相机姿势的输入图像(通常为2-3)生成新视图。其中一些试图在 NeRF 中引入额外的先验,例如深度信息,以增强对稀疏视图场景中 3D 结构的理解。然而,由于在少数视图设置中可用的信息有限,这些方法难以为未观察到的区域生成清晰的新图像。为了解决这个问题,SparseFusion 和 GenNVS 提出学习扩散模型作为图像合成器,用于推断高质量的新视图图像,并利用来自同一类别内其他图像的先验信息。然而,由于扩散模型仅在单个类别中进行训练,因此它在生成看不见的类别中的对象时面临困难,并且需要对每个对象进行进一步的提炼,这使得它仍然不切实际。
SQL (stands for Structured Query Language)
AI 科技评论按:本文来自 Keras 作者 François Chollet,同时也是根据他撰写的《Deeping Learning with Python》一书第 9 章第 2 节改编的。关于当前深度学习的局限性及其未来的思考,François Chollet 共撰写了两篇文章,这篇是其中第一篇。
王小新 编译自 Keras Blog 量子位 出品 | 公众号 QbitAI 从图像处理,到自然语言处理,再到语音识别等多个领域,深度学习都取得了很好的成绩,但是仍存在一些领域,还等待深度学习去攻坚克难。 Keras作者Francois Chollet昨天在博客上发布了一篇文章,讲述了当下深度学习理论的局限性及发展方向。这篇文章是他的深度学习书《Deep Learning with Python》第9章第2节的修改版。 阅读本文需要一定的深度学习基础知识,如了解卷积神经网络、长短期记忆模型和生成对抗网络的基
论文标题:Scale-Hierarchical 3D Object Recognition in Cluttered Scenes
本文改编自我的书"Deep Learning with Python(用Python深度学习)"中第9章第2节( Manning Publications 出版)
近日,湖南大学、厦门大学和德睿智药团队在顶级期刊《IEEE Transactions on Neural Networks and Learning Systems》(IF:10.5)上发表研究论文。IEEE TNNLS创办于1990年,属机器学习、信息科学、人工智能的交叉学科领域,是神经网络和学习系统方面的国际顶级杂志,也是中科院分区1区Top期刊。录用论文标题为《Geometry-based Molecular Generation with Deep Constrained Variational Autoencoder》,该论文致力于研究分子3D表征学习问题,利用分子的几何特征进行分子生成。
这项研究由加州大学洛杉矶分校(UCLA)的六位学者完成,并已被欧洲计算机视觉国际会议(ECCV)采纳。
今天给大家介绍的是ICLR2022上underreview的文章《An autoregressive flow model for 3d molecular geometry generation from scratch》。虽然目前已经开发了多种方法来生成分子图,但从零开始生成分子的三维几何结构问题并没有得到充分的探索。在这项工作中,作者提出了G-SphreNet,一种生成三维分子几何的自回归流模型。G-SphereNet采用了一种一步步将原子放置在三维空间上灵活的顺序生成方案,它并不直接生成三维坐标,而是通过生成距离、角度和扭转角来确定原子的三维位置,从而确保不变性和等变性。此外,作者建议使用球形信息传递和注意力机制进行条件信息提取。实验结果表明,G-SphreNet在随机分子几何结构生成和目标分子发现任务方面优于以往的方法。
允中 发自 凹非寺 量子位 | 公众号 QbitAI 随着计算机图形学的发展,3D生成技术正逐渐成为研究热点。然而,从文本或图像生成3D模型仍然存在许多挑战。 近期,Google、NVIDIA和微软等公司推出了基于神经辐射场(NeRF)的3D生成方法,但这些方法与传统的3D渲染软件(如Unity、Unreal Engine和Maya等)存在兼容性问题,限制了其在实际应用中的广泛应用。 为此,影眸科技与上海科技大学的研发团队提出了一种文本指导的渐进式3D生成框架,旨在解决这些问题。 根据文字描述生成3D资产
---- 新智元报道 编辑:LRS 【新智元导读】AIGC进入3D时代,用文字就能生成超逼真数字人! 随着大型语言模型(LLM)、扩散(Diffusion)等技术的发展,ChatGPT、Midjourney等产品的诞生掀起了新一波的AI热潮,生成式AI也成为备受关注的话题。 与文本和图像不同,3D生成仍处于技术探索阶段。 2022年年底,Google、NVIDIA和微软相继推出了自己的3D生成工作,但大多基于先进的神经辐射场(NeRF)隐式表达,与工业界3D软件如Unity、Unreal Engi
中国人民大学高瓴人工智能学院的研究团队首次将 E(3) 等变图神经网络 (GNN) 应用于配体结合位点预测,提出名为 EquiPocket 的框架,有助于药物发现等各种下游任务。
三维点云为物理世界精细数字化提供了高精度的三维表达方式,广泛应用于三维建模、智慧城市、自主导航系统、增强现实等领域。然而点云的数据海量、非结构化、密度不均等特点给点云的存储和传输带来了巨大挑战,因此在有限的存储空间容量和网络传输带宽中实现低比特率、低失真率的点云压缩具有重要的理论意义和实用价值。
通过Weisfeiler-Leman (WL)图同构测试,对图神经网络(GNN)的表达能力进行了广泛的研究。然而,标准GNNs和WL框架不适用于嵌入欧氏空间的几何图,如生物分子、材料和其他物理系统。
机器之心发布 机器之心编辑部 近日,百度在国际顶级期刊《Nature》旗下子刊 《Nature Machine Intelligence》(Impact score 16.65)上发表了 AI + 生物计算的最新研究成果《Geometry Enhanced Molecular Representation Learning for Property Prediction》,提出 “基于空间结构的化合物表征学习方法”,即 “几何构象增强 AI 算法”(Geometry Enhanced Molecular R
近日,百度在《Nature Machine Intelligence》上发表了AI+生物计算的最新研究成果《Geometry Enhanced Molecular Representation Learning for Property Prediction》,提出“基于空间结构的化合物表征学习方法”,即“几何构象增强AI算法”(Geometry Enhanced Molecular Representation Learning,GEM模型),揭示了一种基于三维空间结构信息的化合物建模方法,以及在药物研发中的应用。
本文主要介绍我们在ICDM‘2021发表的工作,ACE-HGNN: Adaptive Curvature Exploration Hyperbolic Graph Neural Network。
以激光扫描为代表的主动采集装备在易操作性、机动灵活性、智能化、高效化等方面日益成熟,利用三维成像技术采集密集点的空间坐标、色彩纹理和反射强度等信息,可高保真且快速重建被测目标的三维实体,在工程测量、生物医学、智慧城市、虚拟现实(VR)、增强现实(AR)等科学与工程研究中发挥十分重要的作用[1-4]。
近日,百度在国际顶级期刊《Nature》旗下子刊 《Nature Machine Intelligence》(Impact score 16.65)上发表了AI+生物计算的最新研究成果《Geometry Enhanced Molecular Representation Learning for Property Prediction》,提出“基于空间结构的化合物表征学习方法”,即“几何构象增强AI算法”(Geometry Enhanced Molecular Representation Learning,GEM模型),揭示了一种基于三维空间结构信息的化合物建模方法,以及在药物研发中的应用。
为应对更为复杂的任务需求, 现代机器人产业发展愈发迅猛. 出于协调工作的灵活性、柔顺性以及智能性等多项考虑因素, 多臂/多机器人充分发挥了机器人的强大作用, 成为现代机器人产业的重要研究热点. 在机器人双臂协调运行当中, 机械臂之间以及机械臂与外部障碍物之间容易发生碰撞, 可能会造成财产损失甚至人员伤亡. 对机器人碰撞检测方法进行形式化验证, 以球体和胶囊体形式化模型为基础, 构建基本几何体单元之间最短距离和机器人碰撞的高阶逻辑模型, 证明其相关属性及碰撞条件, 建立机器人碰撞检测方法基础定理库, 为多机系统碰撞检测算法可靠性与稳定性的验证提供技术支撑和验证框架.
作者提出了一种语义平面 SLAM 系统,该系统使用来自实例平面分割网络的线索来改进位姿估计和映射。虽然主流方法是使用 RGB-D 传感器,但在这样的系统中使用单目相机仍然面临着鲁棒的数据关联和精确的几何模型拟合等诸多挑战。在大多数现有工作中,几何模型估计问题,例如单应性估计和分段平面重建(piece-wise planar reconstruction,PPR),通常由标准(贪婪)RANSAC解决。然而,在缺乏场景信息(即尺度)的情况下,设置RANSAC的阈值是很非常困难的。在这项工作中,作者认为可以通过最小化涉及空间相干性的能量函数来解决两个提到的几何模型(单应性/3D平面),即图割优化,这也解决了经过训练的CNN的输出是不准确的问题。此外,作者根据实验提出了一种自适应参数设置策略,并完成了对各种开源数据集的综合评估。
几何图是一种具有几何特征的特殊图形,对于建模许多科学问题至关重要。与通用图不同,几何图通常展现出物理对称性,如平移、旋转和反射,使得现有的图神经网络(GNNs)处理它们时效率不高。为了解决这个问题,研究人员提出了多种具有不变性/等变性属性的几何图神经网络,以更好地表征几何图的几何性和拓扑结构。鉴于该领域当前的进展,进行一项关于几何GNNs的数据结构、模型和应用的全面综述是必要的。在本文中,基于必要但简洁的数学预备知识,我们提供了一个从几何消息传递角度对现有模型的统一视角。此外,我们总结了应用及相关数据集,以便于后续研究方法开发和实验评估的研究。我们还在这篇综述的最后讨论了几何GNNs的挑战和未来潜在发展方向。
本文介绍了唐建课题组的Shengchao Liu等人基于3d几何研究的成果:鉴于现实世界场景中 3D 信息的缺乏极大地阻碍了对分子几何图表示的学习,本文提出了一种图预训练框架Graph Multi-View Pre-training (GraphMVP)。GraphMVP通过利用 2D 拓扑结构和 3D 几何视图之间的对应性和一致性来执行自我监督学习(SSL)。该方法有效地学习了一个 2D 分子图编码器,而该编码器之前已通过更丰富和更具辨别力的 3D 几何知识进行了预训练。作者进一步提供理论见解来证明 GraphMVP 的有效性。最后,综合实验表明 GraphMVP优于现有的图 SSL 方法。
AI科技评论按:用图像来重建3D数字几何结构是计算机视觉领域一个非常核心的问题。这种技术在许多领域都有广泛的应用,例如电影制作、视频游戏的内容生成、虚拟现实和增强现实、3D打印等等。伯克利人工智能研究
来源 / Two Minute Papers 翻译 / 于法传 校对 / 凡江 整理 / 雷锋字幕组 本期论文:Hierarchical Surface Prediction for 3D Object Reconstruction 用图像来重建3D数字几何结构是计算机视觉领域一个非常核心的问题。这种技术在许多领域都有广泛的应用,例如电影制作、视频游戏的内容生成、虚拟现实和增强现实、3D打印等等。 伯克利人工智能研究中心的Christian Häne等人发表一篇论文 Hierarchical Surface
这个工作来自于浙江大学和DAMO academy。在点云配准领域,尽管已经有很多方法被提出来,但是无论是传统方法,还是近年来蓬勃发展的基于深度学习的三维点云配置方法,其实在真正应用到真实的LiDAR扫描点云帧时都会出现一些问题。造成这种困窘的一个主要的原因在于LiDAR扫描到的点云分布极不均匀。具体而言,相较于RGBD相机,LiDAR的有效扫描深度要大很多。随着深度的增大,其激光发射出去的扇面将会变得稀疏。因此,即使是扫描同一目标或场景的点云帧之间,其尺度并不一致。导致想要研究的关键点周围的邻域点分布也存在较大不同,难以通过这些3D点的特征描述关联起点云帧。这个问题一直以来都十分棘手。这个工作独辟蹊径,提出对于这种点云数据,不再通过3D点来构建关联以实现点云配准,而是研究点云数据中的高层次的几何原语。这种做法直观来说是有道理的,因为这些高层次的几何原语通常会有较大的支撑点集,换句话说,其对于点云扫描和采样具有较大的鲁棒性,通常不会因为某个点没有被记录而影响相应几何原语的提取。同时,几何原语通常具有更具体的特征和几何结构,例如一条直线、一个平面等,其更容易构建不同帧间的关联,避免误匹配。但是,这种研究思路通常难度较大,原因在于缺乏足够的有标签的数据集。在这种情况下,这个工作显得极其重要,它不仅仅提供了一个数据集自动标注模型,同样也是少数真正开始探索几何原语用于点云配准任务的先河性的工作。
机器学习(machine learning)是人工智能的一个特殊子领域,其目标是仅靠观察训练数据来自动开发程序[即模型(model)]。将数据转换为程序的这个过程叫作学习(learning)
摘要 本文主要讲机器学习中一个非常重要的二类分类模型:支持向量机(Support Vector Machines)。文中主要讲解了SVM的三种模型:线性可分支持向量机、线性支持向量机、非线性支持向量机,重点讲解该模型的原理,及分类决策函数的计算推导过程。 引例小视频 基本方向 首先,SVM不能通过“支持向量机”字面意思来理解。其次,SVM是机器学习中很经典的一个二类分类模型。分类的最终目的是找到样本之间的一条分界线,然后用新样本点和分界线的关系,来判断类别。这是我们的基本思想。 在前面,我们已经学习了
本文介绍了点云中不可忽视的一项重要属性——几何语义,并尝试根据自己的理解和实践经验对其进行一些归纳总结,可能有些地方有理解有误,请大家抱着批判的态度学习。
静息状态功能性磁共振成像(rsfMRI)数据显示出复杂但结构化的模式。然而,在rsfMRI数据中,潜在的起源是不清楚的和纠缠的。在这里,我们建立了一个变分自编码器(VAE),作为一个生成模型可用无监督学习训练,以解开rsfMRI活动的未知来源。在使用人类连接组项目(Human ConnectomeProject)的大量数据进行训练后,该模型学会了使用潜在变量表示和生成皮层活动和连接的模式。潜在表征及其轨迹表征了rsfMRI活动的时空特征。潜变量反映了皮层网络潜轨迹和驱动活动变化的主梯度。表征几何学捕捉到潜在变量之间的协方差或相关性,而不是皮质连通性,可以作为一个更可靠的特征,从一个大群体中准确地识别受试者,即使每个受试者只有短期数据可用。我们的研究结果表明,VAE是现有工具的一个有价值的补充,特别适合于静态fMRI活动的无监督表征学习。
2021年9月29日,来自加拿大蒙特利尔大学魁北克人工智能研究所 (Mila) 的唐建等人在ICLR上发表文章,将3D几何信息整合到图自监督学习模型中,提出了图多视图预训练 (GraphMVP) 框架,为下游的分子性质预测任务提供了更精准的预测方法。
本文介绍一篇来自于苏黎世联邦理工大学的Gisbert Schneider等人的关于几何深度学习的综述《Structure-based Drug Design With Geometric Deep Learning》。
---- 新智元报道 来源:arXiv 编辑:LRS 【新智元导读】长久以来一个观点就是在测试集上表现更好的模型,泛化性一定更好,但事实真是这样吗?LeCun团队最近发了一篇论文,用实验证明了在高维空间下,测试集和训练集没有关系,模型做的一直只有外推没有内插,也就是说训练集下的模型和测试集表现没关系!如此一来,刷榜岂不是毫无意义? 内插(interpolation)和外推(extrapolation)是机器学习、函数近似(function approximation)中两个重要的概念。 在机器学习
如何突破基于 WL 测试和消息传递机制的 GNN 的性能瓶颈?且看几何深度学习旗手、牛津大学教授 Michael Brostein 如是说。 编译丨OGAI 编辑丨陈彩娴 图可以方便地抽象关系和交互的复杂系统。社交网络、高能物理、化学等研究领域都涉及相互作用的对象(无论是人、粒子还是原子)。在这些场景下,图结构数据的重要性日渐凸显,相关方法取得了一系列初步成功,而一系列工业应用使得图深度学习成为机器学习方向的热门研究话题之一。 图注:通过图对复杂系统的关系、交互进行抽象。例如,「分子图」中构成分子的原子至
真实人脸的三维建模、合成与重光照是计算机图形学领域中具有较高应用价值的研究方向。受限于人脸的复杂皮肤组织结构,对于光照效果的准确计算往往依赖前置精细的几何材质建模,以及复杂的光路模拟,需要较高的硬件成本与计算时间开销。
来源:AI科技评论本文约8500字,建议阅读15+分钟本文叫你如何突破基于 WL 测试和消息传递机制的 GNN 的性能瓶颈。 图可以方便地抽象关系和交互的复杂系统。社交网络、高能物理、化学等研究领域都涉及相互作用的对象(无论是人、粒子还是原子)。在这些场景下,图结构数据的重要性日渐凸显,相关方法取得了一系列初步成功,而一系列工业应用使得图深度学习成为机器学习方向的热门研究话题之一。 图注:通过图对复杂系统的关系、交互进行抽象。例如,「分子图」中构成分子的原子至今的化学键,「社交网络」中用户之间的关系和交
智源导读:深度学习的统计神经动力学主要涉及用信息几何的方法对深度随机权值网络进行研究。深度学习技术近年来在计算机视觉、语音识别等任务取得了巨大成功,但是其背后的数学理论发展却很滞后。日本理化所的Shun-ichi Amari先生(中文:甘利俊一)近期在北京智源大会上发表了题为《信息几何法:理解深度神经网络学习机制的重要工具》的演讲。在演讲中,甘利先生梳理了人工神经网络研究的部分重要历史事件,分享了近两年在深度学习理论的一些最新研究成果,指出统计神经动力学方法可以为理解深度学习提供重要的理论工具。
动态视图合成是在给定输入视频的情况下渲染出真实动态场景的新视图,这是计算机视觉和图形学中一个长期存在的研究问题。这个问题的关键在于从多视角视频中有效地重建动态场景的 4D 表示,并允许在任意视点和时间上保持高保真度和实时渲染。
支持向量机(Support Vector Machine,SVM)是众多监督学习方法中十分出色的一种,几乎所有讲述经典机器学习方法的教材都会介绍。关于SVM,流传着一个关于天使与魔鬼的故事。
天上掉钱了!都是红色的毛爷爷!同学们拿着盆跑到操场上接钱,当然谁的盆大谁接到钱的可能性就越大。
机器之心专栏 腾讯AI Lab, 清华AIR&计算机系 一文了解等变图神经网络的结构和相关任务。 近年来,越来越多的人工智能方法在解决传统自然科学等问题上大放异彩, 在一些重要的学科问题(例如蛋白质结构预测)上取得了令人瞩目的进展。在物理领域的研究中,非常多的物理问题都会涉及建模物体的的一些几何特征,例如空间位置,速度,加速度等。这种特征往往可以使用几何图这一形式来表示。不同于一般的图数据,几何图一个非常重要的特征是额外包含旋转,平移,翻转对称性。这些对称性往往反应了某些物理问题的本质。因此,最近以来,大量
1.Learning Dense Correspondences between Photos and Sketches(ICML 2023)
领取专属 10元无门槛券
手把手带您无忧上云