首页
学习
活动
专区
圈层
工具
发布
首页标签计算机视觉

#计算机视觉

计算机视觉与机器学习在语音交互中的应用

用户11764306

2021年10月28日,某中心 Alexa AI 团队的首席应用科学家 Pradeep Natarajan 加入了首席 Alexa 技术推广专家 Jeff Bl...

2700

图像标注核心实践指南:提升模型准确率的关键步骤

用户11764306

图像标注或图像注释是计算机视觉的基石。这是一个为图像数据分配有意义的标签或注释的过程,以使计算机视觉模型能够学习模式并做出预测。无论是目标检测、图像分类还是图像...

2010

英伟达CES 2026炸场:没有新显卡,却掏出了让全球AI公司彻夜难眠的“算力核弹”

CoovallyAIHub

英伟达在CES 2026上抛出一系列重磅炸弹,直接宣告了AI算力工厂时代的到来。没有游戏显卡的更新,却有一场彻底改变AI产业格局的技术革命。

6310

如何用10%的标注数据,达到可媲美全监督模型的性能?AAAI 2026论文揭秘BCSI三大创新设计

CoovallyAIHub

随着人工智能在医学影像分析领域的深入应用,精确的图像分割已成为计算机辅助诊断、手术规划和疗效评估的关键技术。然而,高质量医学图像的标注不仅成本高昂,还需要顶级专...

3310

软件著作权登记证书识别:CV+NLP驱动的文档理解新范式

中科逸视OCR专家

随着我国软件产业的蓬勃发展,软件著作权登记数量持续攀升。据中国版权保护中心统计,2025年全国软件著作权登记总量已突破300万件。面对海量纸质或扫描版的软件著作...

5910

基于视觉大模型的实时监控系统技术实现解析

思通数科

若你正关注计算机视觉技术在货架状态感知场景的落地,寻求低成本、高复用性的实时监控技术方案,那么这款AI视觉系统的技术实现逻辑值得深入探讨。其核心围绕视觉感知与智...

4210

YOLO26正式亮相!极致速度优化,为落地而生!

CoovallyAIHub

就在刚刚,Ultralytics 正式发布 YOLO26,这是迄今为止最先进、最易部署的 YOLO 模型。就是那个在 YOLO Vision 2025 大会上首...

1.2K170

仅192万参数的目标检测模型,Micro-YOLO如何做到目标检测精度与效率兼得

CoovallyAIHub

随着目标检测技术在自动驾驶、安防监控、智能终端等领域的广泛应用,如何在计算资源有限的嵌入式设备中高效部署检测模型,已成为工业界与学术界共同关注的核心问题。传统的...

9310

2026 CES 如何用“视觉”改变生活?机器的“视觉大脑”被点亮

CoovallyAIHub

机器人能叠衣倒水,AI伴侣看懂你的眼神——这一切都因为,机器终于学会了真正地“看”世界。

8510

为AI装上“纠偏”思维链,开源框架Robust-R1显著提升多模态大模型抗退化能力

CoovallyAIHub

如今的多模态大语言模型(MLLMs)已经展现出令人惊叹的图像理解和推理能力,能够回答关于图片的问题、生成描述,甚至进行复杂的视觉推理。然而,一个长期存在的挑战是...

11510

YOLO-Maste开源:首个MoE加速加速实时检测,推理提速17.8%!

CoovallyAIHub

在实时目标检测领域,YOLO系列凭借其一阶段框架,在精度与速度之间取得了卓越的平衡。然而,一个根本性局限长期存在:静态密集计算。

11610

自动化损伤检测:机器视觉与AI的巧妙融合

用户11764306

2020年底,某中心机器人AI团队的高级应用科学家 Sebastian Hoefer 在其同事的支持下,成功提出了一个解决此问题的新颖项目。其想法是:结合计算机...

7410

车辆合格证识别技术:融合计算机视觉技术与自然语言处理技术,实现纸质信息的秒级数字化

中科逸视OCR专家

基于计算机视觉技术与自然语言处理技术深度融合的车辆合格证识别技术应运而生。这套系统不再满足于简单的“看”到文字,而是致力于真正地“读懂”文档,为行业带来了革命性...

8910

工业视觉检测:多模态大模型的诱惑

CoovallyAIHub

他是某家电企业的技术负责人,两年前我们帮他们上了一套基于YOLOv5的外观检测系统,跑得一直不错。

12510

视频语义分割的高效自动标注技术

用户11764306

大多数最先进的计算机视觉模型依赖于监督学习,即使用标注数据进行训练。但标注成本高昂,在语义分割任务中尤其如此,因为需要为图像中的每个像素分配标签。视频中的语义分...

10010

运用前沿技术应对零售与云计算的挑战

用户11764306

在快速数字化转型的现代时代,对工程领导者的期望超越了项目管理者和技术专家的范畴。他们需要成为愿景设定者、创新赋能者和塑造下一代人才的导师。

6810

动态场景神经辐射场优化技术解析

用户11764306

计算机视觉中最引人入胜的挑战之一,是如何通过单个移动相机的快照来理解动态场景。想象一下,从视频或不同角度拍摄的一系列快照中,数字重建一个生动的街道场景或舞者流畅...

8010

【AI加持】基于PyQt5+YOLOv5+DeepSeek的安全帽佩戴检测系统(详细介绍)

懷淰

本系统功能强大!支持对进行检测,支持多种数据数据源输入并且接入了AI实现了对当前分析结果的评估,欢迎了解!

18510

超越Sora的开源思路:如何用预训练组件高效训练你的视频扩散模型?(附训练代码)

CoovallyAIHub

在计算机视觉中,光流通过为每个像素估计一个2D位移向量,来描述两个连续图像帧 x0 和 x1 之间像素的表观运动。

7910

基于神经网络增强体育场配准与片头片尾检测的技术实践

用户11764306

在今年的IEEE冬季计算机视觉应用会议上,某中心的视频服务团队展示了两篇论文。一篇是关于体育场配准,即理解体育视频中描绘物体之间的空间关系。另一篇是关于片头与剧...

7010
领券