首页
学习
活动
专区
圈层
工具
发布
首页标签计算机视觉

#计算机视觉

从“模仿”到“进化”!华科&小米开源MindDrive:在线强化学习重塑「语言-动作」闭环驾驶

CoovallyAIHub

近年来,端到端自动驾驶技术逐渐成为行业主流,而融合视觉、语言与动作的 VLA(Vision-Language-Action)模型则被视为突破传统模块化瓶颈的关键...

500

SAM 真的开始「分割一切」,从图像到声音,Meta 开源 SAM Audio

CoovallyAIHub

继 SAM(Segment Anything Model) 与 SAM 3D 之后,Meta 正式将 Segment Anything 系列扩展到了音频领域。

2200

持续预训练构建地理空间基础模型

用户11764306

地理空间技术在全球的重要性与日俱增。通过更好地理解地球不断变化的景观以及我们与环境之间复杂的相互作用,这些技术帮助我们应对复杂的全球性挑战。随着地理空间数据量的...

700

何恺明NeurIPS 2025演讲盘点:视觉目标检测三十年

机器之心

凡是接触过计算机视觉的人,对这个名字绝不陌生。自 2015 年发表以来,《Faster R-CNN》无疑成为了该领域最具里程碑意义的工作之一。它不仅一举奠定了现...

3210

零样本学习与对比训练提升Logo识别技术

用户11764306

Logo识别是识别特定Logo及其在图像或视频中位置的任务citation:2。这项技术有助于创造安全可信的购物体验,例如识别包含冒犯性符号或企业商标的图像。

4710

夜间、远距离都不怕!新型无人机识别算法准确率超92%

CoovallyAIHub

无人机应用的普及给社会带来便利的同时,也带来了新的安全隐患。未经许可的无人机入侵机场、军事区等敏感区域,已成为不容忽视的安全威胁。如何在复杂环境中,尤其是在夜间...

7010

下一代驾驶员监测系统如何工作?视觉AI接管驾驶舱

CoovallyAIHub

特别是得益于计算机视觉——人工智能(AI)的一个分支——机器现在能够像人类一样解读图像和视频。在车辆上,计算机视觉可用于驾驶员注意力监测系统,分析司机的姿势、面...

4310

是什么支撑L3自动驾驶落地?读懂AI驾驶与碰撞预测

CoovallyAIHub

就在昨天,中国首批L3级自动驾驶车辆正式获得上路许可,标志着我国无人驾驶正式迈入“商业化应用”新纪元。这意味着,在法规允许的路段和条件下,驾驶员可以将车辆完全交...

7500

复杂工业场景如何实现3D实例与部件一体化分割?多视角贝叶斯融合的分层图像引导框架

CoovallyAIHub

在机器人操作、数字孪生等工业智能化场景中,精确的3D场景理解是核心技术基础。尤其在工厂环境中,零部件布局密集、尺度差异大、遮挡严重,传统分割方法往难以同时保证实...

8510

提升GAN可控性:精确操控合成图像的属性

用户11764306

生成对抗网络(GAN)近年来在从零开始合成逼真视觉图像方面展现出了卓越的能力。然而,要精确控制GAN输出图像的特定特征——例如光照条件、视角,或者人物是微笑还是...

9610

新型图像与视频生成模型技术详解

用户11764306

在昨日举行的某中心年度re:Invent大会上,首席执行官宣布推出Nova系列模型,这是新一代最先进的、提供前沿智能和行业领先性价比的基础模型。Nova系列模型...

10710

如何让AI的数据标注“火眼金睛”?人机协同才是可靠途径

CoovallyAIHub

二十年前,要是有人说想买个机器人帮忙做家务,听起来简直像天方夜谭。然而,如今我们正处在人工智能蓬勃发展的时代,机器人已经在类似场景中进行测试了。

2800

震后如何快速评估上万栋建筑?俄亥俄州立大学提出混合智能检测方案

CoovallyAIHub

地震事件后及时评估结构的完整性对于公共安全和应急响应至关重要。工程师们面临着一个紧迫的难题:如何在最短时间内评估成千上万栋建筑物的损伤情况,确定哪些建筑可以继续...

8910

告别“消失的小目标”:航拍图像检测新框架,精度飙升25.7%的秘诀

CoovallyAIHub

在人工智能迅猛发展的今天,目标检测作为机器视觉的核心任务,已经在自动驾驶、安防监控、工业质检等领域发挥着关键作用。然而,当我们把目光投向广阔的天空,面对航拍图像...

17710

滑雪季又来了!如何用计算机视觉帮雪场解决最头疼的问题

CoovallyAIHub

所以想做一件简单但有用的事——用摄像头 + 计算机视觉算法,直接数队伍里到底有多少人,再算出真实的等待时间。

9810

【AI加持】基于PyQt5+YOLOv8+DeepSeek的钢筋点数系统(详细介绍)

懷淰

本系统功能强大!支持对图片、视频、视频流、摄像头中的支持对钢筋数量进行统计,支持多种数据数据源输入并且接入了AI实现了对当前分析结果的评估,欢迎了解!

13910

【AI加持】基于PyQt5+YOLOv8+DeepSeek的变压器漏油检测系统(详细介绍)

懷淰

本系统功能强大!支持对图片、视频、视频流、摄像头中的变压器漏油现象进行检测,支持多种数据数据源输入并且接入了AI实现了对当前分析结果的评估,欢迎了解!

14810
领券