前不久,清华大学研究团队继YOLOv10后再次推出全新模型YOLOE(Real-Time Seeing Anything)。
自VQGAN和潜在扩散模型等流行的视觉生成框架出现以来,最先进的图像生成系统一般都是两阶段系统,首先将视觉数据标记化或压缩到低维潜在空间,然后再学习生成模型。标...
人工智能技术要真正发挥其价值,必须与生产生活深度融合,为产业发展和人类生活带来实际效益。近年来,基于深度学习的机器视觉技术在工业自动化领域取得了显著进展,其中Y...
传统的目标检测模型受到封闭数据集的限制,只能检测训练过程中遇到的类别。虽然多模态模型通过对齐文本和图像模态扩展了类别识别,但由于跨模态融合,它们引入了大量过度推...
在传统软件开发中,DevOps通过自动化工具链和持续集成/交付(CI/CD)打破了开发与运维的壁垒,成为软件工业化的基石。然而,当AI技术尤其是计算机视觉(CV...
在现代工业中,无缝钢管被誉为“工业的血管”,广泛应用于航空航天、汽车制造等领域。然而,无缝钢管内表面的缺陷检测一直是一个技术难题,尤其是面对样本数量不足和缺陷类...
计算机视觉(Computer Vision, CV)是人工智能领域中最为引人注目的分支之一。从自动驾驶汽车到医疗影像分析,从智能安防系统到虚拟现实体验,计算机视...
针对传统猪肉新鲜度检测方法效率低、破坏性强的问题,本研究提出一种基于EfficientNet框架的智能无损检测技术。通过采集2500张原始猪肉图像,结合旋转、缩...
之前小编分享过关于《YOLO11-CBAM集成:提升商业苹果园树干与树枝分割的精准度》,改进YOLO11算法后,进行苹果树的实例分割。本期文章我们将分享关于最新...
在前面系列文章中我们从数据清洗、数据质量评估再到数据预处理和数据增强,详细介绍了相关的技术和代码解析。
在计算机视觉领域,何恺明团队再次引领技术浪潮。他们最新提出的去噪哈密顿网络(Denoising Hamiltonian Network, DHN),首次将物理规...
后向消除法(Backward Elimination)是一种基于统计推断的逐步回归方法,通过系统性剔除冗余特征来优化模型性能。该算法在构建高解释性预测模型时具有...
现有的基于深度学习的物体检测模型在日间条件下表现良好,但在夜间却面临巨大挑战,这主要是因为这些模型主要是在日间图像上进行训练的。此外,使用夜间图像进行训练还带来...
YOLOv11的模型配置文件在ultralytics/cfg/models/11中,里面包含目标检测、实例分割、图像分类、关键点/姿态估计以及旋转目标检测,本文...
2月18日,头部大模型创业公司阶跃星辰宣布开源了文生视频模型Step-Video-T2V,Gitee AI 第一时间上线了该模型的在线体验。
就在近日,中国团队推出的通用AI智能体Manus引发了科技界与资本市场的双重震动。作为首个在GAIA基准测试中超越OpenAI同层次模型的智能体,Manus不仅...
在本研究中,我们通过将卷积块注意力模块(CBAM)与YOLO11架构相结合,开发了一种定制的实例分割模型。该模型在休眠期和树冠期苹果园图像的混合数据集上进行了训...