近来,计算机视觉的进步正让这一切发生根本性改变。计算机视觉是人工智能的一个分支,它赋予机器“看懂”图像和视频的能力,正在使运动追踪变得更精准、更自动,也更普及。...
十年前,如果有人问起“谁能造出最好的GPU”,答案几乎毫无悬念——英伟达与AMD,两家美国巨头牢牢把持着全球GPU市场的王座。彼时的中国,在被誉为“AI算力心脏...
年来,随着无人机技术的快速发展和低空经济政策的推进,无人机在智慧城市、交通巡检、应急救援等领域的应用日益广泛。然而,无人机的智能化离不开高质量视觉数据的支持。那...
当今视觉追踪领域,一项全新任务正引发学术界和工业界的关注。这项被称为「无人机对抗无人机」的挑战将追踪技术的难度推向了全新高度。
近年来,端到端自动驾驶技术逐渐成为行业主流,而融合视觉、语言与动作的 VLA(Vision-Language-Action)模型则被视为突破传统模块化瓶颈的关键...
继 SAM(Segment Anything Model) 与 SAM 3D 之后,Meta 正式将 Segment Anything 系列扩展到了音频领域。
地理空间技术在全球的重要性与日俱增。通过更好地理解地球不断变化的景观以及我们与环境之间复杂的相互作用,这些技术帮助我们应对复杂的全球性挑战。随着地理空间数据量的...
凡是接触过计算机视觉的人,对这个名字绝不陌生。自 2015 年发表以来,《Faster R-CNN》无疑成为了该领域最具里程碑意义的工作之一。它不仅一举奠定了现...
Logo识别是识别特定Logo及其在图像或视频中位置的任务citation:2。这项技术有助于创造安全可信的购物体验,例如识别包含冒犯性符号或企业商标的图像。
无人机应用的普及给社会带来便利的同时,也带来了新的安全隐患。未经许可的无人机入侵机场、军事区等敏感区域,已成为不容忽视的安全威胁。如何在复杂环境中,尤其是在夜间...
特别是得益于计算机视觉——人工智能(AI)的一个分支——机器现在能够像人类一样解读图像和视频。在车辆上,计算机视觉可用于驾驶员注意力监测系统,分析司机的姿势、面...
就在昨天,中国首批L3级自动驾驶车辆正式获得上路许可,标志着我国无人驾驶正式迈入“商业化应用”新纪元。这意味着,在法规允许的路段和条件下,驾驶员可以将车辆完全交...
在机器人操作、数字孪生等工业智能化场景中,精确的3D场景理解是核心技术基础。尤其在工厂环境中,零部件布局密集、尺度差异大、遮挡严重,传统分割方法往难以同时保证实...
生成对抗网络(GAN)近年来在从零开始合成逼真视觉图像方面展现出了卓越的能力。然而,要精确控制GAN输出图像的特定特征——例如光照条件、视角,或者人物是微笑还是...
在昨日举行的某中心年度re:Invent大会上,首席执行官宣布推出Nova系列模型,这是新一代最先进的、提供前沿智能和行业领先性价比的基础模型。Nova系列模型...
二十年前,要是有人说想买个机器人帮忙做家务,听起来简直像天方夜谭。然而,如今我们正处在人工智能蓬勃发展的时代,机器人已经在类似场景中进行测试了。