首页
学习
活动
专区
圈层
工具
发布
首页标签计算机视觉

#计算机视觉

Gemini 3 Pro (BananaPro) 深度解析:当绘图模型拥有“逻辑大脑” —— API Key 获取与 Python 实战指南

攻坚克难的那份表

当生成式 AI 还在努力通过“去噪”来模拟艺术时,Google DeepMind 抛出了一枚重磅炸弹:Nano Banana Pro(官方名称 Gemini 3...

21710

分割万事万物的AI,再进化!Meta SAM 3 来了,支持中文提示词!

CoovallyAIHub

深夜,Meta 又一次给 AI 视觉领域丢下重磅炸弹——SAM 3(Segment Anything Model 3)与 SAM 3D 全面发布!

24630

LeCun在Meta的最后绝唱?50行代码证明AI的另一种可能

CoovallyAIHub

就在AI界为Yann LeCun离职Meta的消息震惊时,一份意外的“告别礼物”悄然出现在arXiv上——这位图灵奖得主与Randall Balestriero...

8610

去噪扩散模型,根本不去噪?何恺明新论文回归「去噪」本质

CoovallyAIHub

这一研究使去噪扩散模型回归本源,探索一种在原始自然数据上构建基于 Transformer 的扩散模型的自洽范式。它不仅对计算机视觉领域有重要意义,也为其他涉及原...

33820

基于SimCLR的自监督 YOLO:YOLOv5/8也能在低标注场景目标检测性能飙升

CoovallyAIHub

自监督学习的核心思想是:从数据本身自动生成“标签”或“监督信号”,而无需依赖昂贵且耗时的人工标注。

8500

CV研究告别数据荒?PAN世界模型实现「多步推理与规划」,可自造高质量训练数据

CoovallyAIHub

你是否曾想象过,如果AI不仅能生成视频,还能像人类一样“想象”世界的演变、预测动作的后果、甚至进行多步推理与规划,会是怎样的情景?

8510

智能体与小模型:AI迈向平民化的新浪潮

CoovallyAIHub

数百亿参数、庞大算力需求、昂贵的部署成本……当科技巨头们还在追求“更大更强”的AI模型时,一股反向而行的趋势正悄然兴起,并可能彻底改变人工智能的应用格局。

9310

超越像素的视觉:亚像素边缘检测原理、方法与实战

CoovallyAIHub

在计算机视觉领域,单个像素常常会成为我们测量能力的极限——但这并非无法突破。在计量学和精密机器人等领域,哪怕仅仅一个像素的误差,都可能转化为微米级的实际偏差。为...

23110

中科大西工大提出RSKT-Seg:精度速度双提升,开放词汇分割不再难

CoovallyAIHub

近年来,随着视觉-语言模型的快速发展,开放词汇分割(OVS)技术已成为自然图像处理领域的热点。这项技术让模型能够根据文本描述来分割任意类别的物体,打破了传统语义...

10010

即插即用涨点系列 (六):AAAI 2025,PConv & SD Loss 详解!融合风车卷积与动态损失的涨点新范式。

AITricks

论文原文 (Paper):https://arxiv.org/pdf/2412.16986 官方代码 (Code):https://github.com/JN-...

15510

《XR应用开发者头显运行需求调研报告》重磅发布 ,开发者更加关注集成和可扩展性!

Paraverse平行云

近期,LarkXR发布了一项新的解决方案,实现了3D/XR企业级应用全面接入Apple Vision Pro等头显设备。作为长期陪伴在XR行业开发者身边的技术伙...

6410

跨机器人、跨任务!北大提出通用导航基础模型NavFoM,登顶多个SOTA基准

CoovallyAIHub

具身人工智能正在成为AI领域的热门方向,而导航能力是智能体在物理环境中生存和完成任务的基础。想象一个智能体既能在室内为你端茶送水,又能在户外巡逻监控,甚至驾驶汽...

9410

结构化数据迎来“ChatGPT时刻”!LimitX:一个模型统一所有表格任务

CoovallyAIHub

在大语言模型如ChatGPT、GPT-4重塑自然语言处理范式,多模态模型征服图像、视频之后,人工智能的下一个前沿阵地正悄然浮现——结构化数据。

16010

2025年计算机视觉基础任务:从物体检测到关键点定位

安全风信子

计算机视觉是人工智能领域的重要分支,它致力于使计算机能够理解和分析图像和视频内容。物体检测和关键点检测是计算机视觉的两大基础任务,它们为更高级的视觉任务如实例分...

15810

2025年计算机视觉高级特征与应用:从特征提取到异常检测的全栈技术

安全风信子

在当今数字化时代,计算机视觉技术正以前所未有的速度发展,深刻改变着我们的生活和工作方式。从自动驾驶到智能安防,从医疗诊断到工业检测,计算机视觉技术的应用场景日益...

16310

2025年全面掌握计算机视觉技术:从基础识别到高级应用

安全风信子

计算机视觉(Computer Vision)作为人工智能领域的核心分支,已经成为连接计算机与视觉世界的重要桥梁。从自动驾驶到安防监控,从医疗诊断到智能零售,计算...

14110

2025年计算机视觉三驾马车:物体检测、关键点检测与掩码生成技术全解析

安全风信子

计算机视觉作为人工智能领域的核心分支,正以惊人的速度改变着我们的生活和工作方式。2025年,随着深度学习技术的飞速发展和计算能力的提升,物体检测、关键点检测和掩...

19110

让Qwen-VL的检测能力像YOLO一样强,VLM-FO1如何打通大模型的视觉任督二脉

CoovallyAIHub

在当今多模态大模型(VLMs)飞速发展的时代,一个令人尴尬的问题依然存在:为什么这些能看懂图像、生成描述的模型,却难以精确地定位图像中的物体?

30010

突破跨模态识别瓶颈!火箭军工程大学提出MFENet:让AI在白天黑夜都能准确识人

CoovallyAIHub

想象这样一个安防场景:白天,监控摄像头(可见光模式)清晰地捕捉到一个人的影像;到了夜晚,摄像头自动切换到红外模式,画面变成了基于热辐射的黑白图像。对于人类来说,...

9210
领券