腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

文章/答案/技术大牛

发布

综合排序丨最热优先丨最新优先

AI+实时仿真——三维力场感知

通过摄像头抓取结构的三维应力场，现寻求有相关诉求的合作方。从想到这个idea开始，我们购买了手抛小飞机，进行了三维建模和对应的CAE仿真，后续通过模型降解实现边缘侧的部署，最终实现了通过摄像头获取小飞机的三维受力特征。

2025-09-04

2860

标签:

NeurIPS 2022 | GeoD：用几何感知鉴别器改进三维感知图像合成

01 介绍三维感知图像合成因其在三维世界建模中的潜力而受到越来越多的关注。与主要关注图像质量和多样性的2D相比[1,13–16,28]，3D感知生成也有望获取合成图像背后的精确的3D形状。 02 相关工作 2.1 三维感知图像合成近年来，三维感知图像合成受到了广泛的关注。与2DGANs的主要区别在于在生成器中使用了3D表示。由于NeRF在三维重建和新视图合成方面的强大性能，最近在3D感知图像合成方面的尝试提出引入生成神经辐射场(G-NeRF) [29]，，用于生成器。 3.2 几何感知辨别回想一下，我们在鉴别器中引入了一个几何分支，为发生器提供三维监控信号。在这一部分，我们会介绍如何结合几何分支来构建一个几何感知鉴别器，以改进三维感知图像合成。由于我们的几何感知鉴别器，GeoD中的生成器能够学习更精确的三维形状，因此反转它可以实现更好的形状重建。

一点人工一点智能

2022-12-27

9800

标签:

具身智能中的多模态三维感知思考

本期精彩从驾驶场景到室内场景，具身三维感知系统面对的是更复杂的室内语义，更多样的物体类别和朝向，以及大不相同的感知空间和需求。重新思考其中差异和数据基础，EmbodiedScan 团队构造了一套基于第一视角的多模态全场景三维感知系统/工具包，从数据标注到模型训练，从基准构建到任务评测，以大规模真实场景扫描和面向下游的全面标注为基础本期社区开放麦，我们特别邀请到上海人工智能实验室青年研究员王泰带来《具身智能中的多模态三维感知思考》的分享，该研究近期被 CVPR 2024 接收，更多精彩内容请锁定本周四晚 20:00 的社区开放麦直播分享内容 •从驾驶场景到室内场景：新的问题与挑战 •EmbodiedScan：首个多模态、基于第一视角的真实场景三维感知数据集 •Embodied Perceptron：适配任意帧输入的统一基线框架 • 图 2：EmbodiedScan 提供了一个多模态、基于第一视角的三维感知数据集，其中包含大量的真实扫描数据和全面且丰富的标注，从而构建了一个针对真实世界机器人基于语言的三维场景整体理解方面的评测基准。

OpenMMLab 官方账号

2024-03-07

1.5K0

标签:

VoxGRAF：基于稀疏体素的快速三维感知图像合成

然而，将 GAN 扩展到三维则相对困难，因为用于监督的三维真实模型难以获得。近期，3D-aware GAN 解决了人工制作的三维模型以及缺乏三维约束的用于图像合成的 2D GAN 之间的不匹配问题。 GRAF 采用了 NeRF 中基于坐标的场景表示方法，提出了一种使用基于坐标的 MLP 和体渲染的 3D-aware GAN，将基于 3D 感知的图像合成推进到更高的图像分辨率，同时基于物理真实且无参数的渲染，保持了场景的三维一致性。然而在三维场景进行密集采样会产生巨大的消耗，同时三维的内容经常与观察视角纠缠在一起，而进行下游应用时，场景的三维表征往往需要集成到物理引擎中，因此难以直接获得场景三维内容的高分辨率表征。在具体的实现方面，为了得到的结果是三维体素而不是二维像素，作者将 StyleGAN2 生成器中的二维操作扩展为等价的三维操作。

2022-11-07

1.6K0

标签:

伦敦大学提出 SAMa: 材料感知三维选择和分割！

材料选择在最近的生成三维资产创建和图像/文本到三维的工作流中变得尤为重要。在本研究中，作者弥合了二维和三维材料选择之间的差距，并提出了一种高效且准确的三维物体材料选择与分割方法。利用这一特性，作者提出了一种无需任何预处理的、轻量级的、三维表示无关的二维到三维提升方法。因此，作者选择将来自多个视角的相似度图融合成一个轻量级的三维相似度点云。从这个点云中，作者可以轻松地以交互速率重建并显示连续的三维选择。材料感知的3D高斯分布。对于3D高斯分布，作者使用了第5.1节中描述的材料分割步骤。

2025-02-19

6960

标签:

StereoLabs：重新定义三维感知的计算机视觉先锋

引言在当今快速发展的计算机视觉和机器人技术领域，三维空间感知已成为自动驾驶、AR/VR、智能监控等应用的核心技术需求。 StereoLabs作为一家专注于立体视觉解决方案的创新公司，凭借其先进的ZED系列深度相机和强大的SDK，正在为行业带来革命性的三维感知能力。云端服务扩展除了本地SDK，StereoLabs正在发展云端三维视觉服务，为移动设备和低算力终端提供远程三维感知能力。总结StereoLabs通过创新的立体视觉技术，为计算机视觉领域提供了强大而灵活的三维感知解决方案。关键词：StereoLabs,立体视觉,深度相机,ZEDSDK,计算机视觉,三维感知,深度估计,SLAM,机器人视觉,视觉感知

Scivaro_科采通

2026-01-09

4320

标签:

机器人视觉

活动 | 机器感知、三维点云如何与深度学习擦出火花？

机器人需要在这个过程中学会如何主动感知和控制，深度学习的流行也为探索这一问题提供了一种值得借鉴和学习的方法。 ? AI 科技评论按：ICRA 2018 正于近期在澳大利亚布里斯班举行。 AI 科技评论从议程进行不完全统计，机器感知与控制仍然是 ICRA 2018 的关注重点。等问题，这就涉及到非常多的问题，比如三维重建，视觉测距、对象分类、人类/物体的姿态估计、语义分割、匹配，识别和本地化等。也就是说，机器人需要在这个过程中学会如何主动感知和控制。在三维点云及即时检测、多任务检测上，深度学习对机器人的研究也有着不少先进成果。不论是机器感知，或是以三维点云为代表的技术，在利用深度学习探索的过程中，必然还是会遇到同样的问题。

2018-07-26

1K0

标签:

VideoScene：以三维感知跳跃流蒸馏策略破局，高效弥合从Sparse视图到三维场景的差距！

具体而言，作者设计了一种三维感知跳跃流蒸馏策略，以跳过耗时冗余信息，并训练一个动态去噪策略网络，以在推理过程中自适应地确定最佳跳跃时间步长。这个初始的3D感知视频建立了一个强大的先验知识，指导后续的扩散步骤，使作者能够跳过不确定阶段，专注于一致性蒸馏中的确定性目标场景[75]。为解决这些局限性，作者提出了VideoScene框架，该框架使用三维感知跳跃流蒸馏来整合三维先验知识，实现一致的三维视频生成，同时通过单步扩散去噪加速快速高质量生成。 3. 方法 3.1. 基于三维感知的LeapFlow蒸馏在一致性蒸馏训练[55]中，传统的噪声调度器从数据分布中采样初始真实值，并应用噪声通过正向扩散在随机时间步生成，具体方法如下：高斯噪声，和定义了随机插值综上所述，作者的3D感知跳跃流蒸馏通过避免依赖真实信号并绕过在附近低效的早期去噪步骤，从而减少了训练与推理之间的差异。

2025-05-27

7320

标签:

当视觉遇到毫米波雷达：自动驾驶的三维目标感知基准

公众号致力于点云处理，SLAM，三维视觉，高精地图等领域相关内容的干货分享。侵权或转载联系微信cloudpoint9527。摘要传感器融合对于自动驾驶车辆上的准确和鲁棒的感知系统至关重要。从摄像机获取丰富的语义信息，以及从雷达获取可靠的三维信息，潜在地可以实现对于3D目标感知任务的高效、廉价和便携的解决方案。它包含不同的光照条件，对于基于视觉的对象感知方法具有挑战性，因此为基于传感器融合的对象感知算法提供了一个很好的基准。用于三维点云语义分割的标注工具和城市数据集 ROS2入门之基本介绍固态激光雷达和相机系统的自动标定激光雷达+GPS+IMU+轮速计的传感器融合定位方案基于稀疏语义视觉特征的道路场景的建图与定位自动驾驶中基于激光雷达的车辆道路和人行道实时检测（代码开源）用于三维点云语义分割的标注工具和城市数据集更多文章可查看：点云学习历史文章大汇总 SLAM及AR相关分享 TOF相机原理介绍 TOF

点云PCL博主

2023-12-12

1.3K0

标签:

. | 引导等变扩散驱动的靶标感知三维分子生成

现有的分子生成模型在结构基础的药物设计中常常忽视结构合理性和药物样性质，因而生成不真实的三维分子。近年来，几何深度学习推动了基于蛋白口袋的三维分子生成方法的发展，但已有模型往往存在结构扭曲、缺乏药物样性质等问题。结果 DiffGui 框架概述 DiffGui 是一种非自回归的目标感知分子生成模型，基于等变扩散框架构建。讨论生成能够在蛋白口袋中稳定结合的三维分子是药物设计中的重大挑战。

2025-09-02

4020

标签: