首页
学习
活动
专区
圈层
工具
发布
首页标签计算机视觉

#计算机视觉

人工智能之视觉领域 计算机视觉 第二章 环境搭建(Windows/Mac/Linux通用)

咚咚王

学习目标:能独立在任意主流操作系统上,快速、正确地搭建 OpenCV 的 Python 开发环境,并验证安装是否成功。

600

突破轻量检测瓶颈:为YOLO注入增强特征融合与优化感受野的新动力

AI小怪兽

1)提出HP-CSE模块:设计了一种混合池化卷积压缩激励模块,通过结合最大池化与平均池化,并利用1x1卷积替代全连接层,以极低的计算成本实现了更精细的多尺度通道...

2910

当 Agent 成为主角,视觉研究者该怎么办?

CoovallyAIHub

它没有体现在排行榜上,也没有写在 SOTA 的红字里,但你一旦意识到,就很难再忽视。

3010

突破认知边界!中科院等提出MIRROR框架:AI鉴伪从此有了“真实之镜”

CoovallyAIHub

当AI画作已能以假乱真,人类如何守住现实边界?新一代检测框架通过建模“真实本身”实现超人级鉴别能力。

4210

人工智能之视觉领域 计算机视觉 第一章 基础概念

咚咚王

OpenCV(Open Source Computer Vision Library) 是一个开源的、跨平台的计算机视觉和机器学习软件库。你可以把它想象成一个装...

3800

让本地知识引导AI追踪社区变迁,让AI真正理解社会现象

CoovallyAIHub

最近有一项研究让我十分好奇,它似乎在尝试翻转我们熟悉的剧本——不是用人工智能去“分析”社区,而是让社区来“教会”人工智能如何看世界。这听起来像是一种充满温度的技...

5410

AAAI 2026这篇杰出论文说了什么?用LLM给CLIP换了个“聪明大脑”

CoovallyAIHub

在多模态大模型飞速发展的今天,CLIP作为连接视觉与语言的“基石”依然发挥着重要作用。然而,随着应用场景的深入,研究人员逐渐发现CLIP的文本编码器已经成为整个...

8810

AI驱动的计算框架助力视觉系统演化研究

用户11764306

科学家无法回到过去研究塑造自然界多样视觉系统的环境压力,但某机构的研究人员开发了一种新的计算框架,使他们能够在人工智能体中探索这种演化。

7810

为什么 2026 年,3D 工业视觉成为视觉算法分化的一年?

CoovallyAIHub

参数一路狂飙:像素更高、帧率更快、功率更猛、视角更广、体积更小。单看规格表,很难不让人兴奋。但真正把设备装上产线的人,往往会在几周后露出一种复杂的表情——系统确...

9710

YOLOE-26发布:能听懂人话的实时开放词汇分割模型来了!

CoovallyAIHub

在计算机视觉领域,YOLO系列一直是速度和精度的代名词。但长期以来,所有YOLO模型都存在一个根本性限制:它们只能识别训练时见过的类别。

20010

红外小目标检测新突破!浙大团队提出DQAligner:大位移场景下依然稳定跟踪

CoovallyAIHub

红外成像领域的小目标检测一直是个技术难题——目标可能只是几个像素点,还常常淹没在复杂的云层、海面背景或者传感器噪声里。

12410

参数仅6.31亿反超7B模型,NVIDIA用「多教师蒸馏」融合三大模型绝学

CoovallyAIHub

在追求模型规模的竞赛中,一个反直觉的事实正在发生:NVIDIA 的 C-RADIOv4 仅用 6.31 亿个参数就达到了 DINOv3 的 70 亿参数模型的性...

15510

为视觉建模注入物理灵魂:WaveFormer证明,下一站是“物理启发模型”

CoovallyAIHub

近年来,Transformer 席卷了计算机视觉领域,从图像分类到目标检测,表现亮眼。然而,当任务从静态图像扩展到视频理解、动态场景分析时,Transforme...

11810

“看起来像世界”≠“真世界”!WorldLens全维度解构自动驾驶世界模型

CoovallyAIHub

近年来,随着生成式AI技术的突破,世界模型(World Models) 已成为自动驾驶与具身智能领域的核心研究方向。从文本直接生成驾驶视频,到可控的4D动态场景...

14110

一步生成,像素空间,何恺明让 pMF 做到了

CoovallyAIHub

何恺明团队最近抛出的这篇工作,多少有点“把老问题直接掀桌子重来”的味道。他们提出的 Pixel MeanFlow(pMF),在不借助潜在空间、不依赖多步采样的前...

16210

CVPR 2025 Oral | 港大提出OverLoCK:模仿人类视觉机制,让模型“先见森林,再见树木”

CoovallyAIHub

人类在观察复杂场景时,通常会先快速扫视整体轮廓,形成初步认知,再集中注意力到关键区域进行细节分析。这种 “纵观全局-聚焦细节” 的两阶段认知机制被称为自上而下注...

11110

告别CLIP局限!SSVP框架实现零样本异常检测,刷新7大数据集SOTA

CoovallyAIHub

工业视觉检测一直是智能制造领域的关键技术,而零样本异常检测(ZSAD)更是被视为行业的“圣杯”——无需针对特定产线进行训练,即可直接投入使用的理想解决方案。然而...

12210

测试里“无所不能”,一上线就“ bug 频出”,你的CV模型到底缺了什么?

CoovallyAIHub

那个在象牙塔里从未失手的“学霸”,理论知识门门满分,实验操作无可挑剔。可当他第一次踏入纷繁复杂、充满意外的真实社会,却步步维艰,处处碰壁——这画面,是不是像极了...

9410

强化学习研究者的成长之路与技术探索

用户11764306

Alexander Long 原计划追随父亲的脚步,在石油和天然气行业工作。在他的祖国澳大利亚,该行业是电气工程师的主要雇主,因此在他于昆士兰大学获得学士学位后...

10610

图像到地图转换技术获最佳论文奖

用户11764306

今天,在2022年国际机器人与自动化会议上,笔者与萨里大学同事合作撰写的论文《将图像转换为地图》获得了大会最高优秀论文奖。我们的论文解决了基于标准侧向视角照片构...

6410
领券