经常“打螺丝“的”吃席“观众就会发现,你看这个手机屏幕有没有划痕、这个构件有没有缺陷,要左手拿个电灯,右手拿起这个物品,反复的看反复的摸,大概耗时一分钟以上,一坤时以下,这个物品就被你”品鉴“出来了。如果后面”老板“发现还有被你遗漏的问题,”两电炮“是难免的。就像那句话:使卵石臻于完美的,并非锤的打击,而是水的且歌且舞,真正推动变革的并非被动应付,而是主动求索的精神,追求效率的操作者,为突破人工检测的局限,摸索出了机器视觉这个东西。
不能再水了,再水你们要给作者我”两电炮“了。下面就介绍机器视觉是什么,怎么用,以及后续相机像素和镜头选型(没有推荐广告,放心食用)。
机器视觉是通过光学的、非接触的传感器自动地获取和解释处理一个真实物体的图像以获取所需信息或用于控制机器运动或过程。不少人会把计算机视觉(cv)等同于机器视觉,其实不然。计算机视觉更多注重图像信号本身的研究以及和图像相关的交叉学科研究,而机器视觉在其基础上还需要考虑机器的运动等更加现实的问题。
机器视觉系统主要包含:图像采集、图像处理、特征提取、判决和控制。具体如下图可以看到,流水线设备将构件推送到摄像头视野内,通过一定间隔时段拍照、上传、后台处理、条件判断,最后控制流水线部分单元开关。
CCD与CMOS是两种不同的感光器件作为相机的主要组成部分,以下描述了两者之间的差异。
实际场景下,需要对特定大小的构建,规定的工作距离下选择相机像素大小,本文通过引入”一个 100×100 毫米的产品在 50 厘米工作距离下的测量需求“为例进行案例分析(具体看下方详细内容)。
这篇文章旨在帮助想要学习机器视觉,但却不知道如何了解该领域的同学,或具有一定经验的工程师进行细节了解。如果你对机器视觉感兴趣,想了解更多技术细节,可以阅读下面详细细节或在欢迎在评论区留言。
机器视觉(MV,Machine vision)技术涉及数字图像处理技术、模式识别、自动控制、光源和光学成像知识、模拟与数字视频技术、计算机软硬件和人机接口等多学科理论和技术1。美国制造工程师协会(SME,Society of Manufacturing Engineers)机器视觉分会和美国机器人工业协会(RA,Robotic Industries Association)的自动化视觉分会对机器视觉的定义:“机器视觉是通过光学的、非接触的传感器自动地获取和解释处理一个真实物体的图像以获取所需信息或用于控制机器运动或过程”。因此由于视觉传感的检测方法以其可靠性高、无接触、包含信息丰富等优势得到了学术界和工业界的广泛关注。
计算机视觉和机器视觉是有一定区别的2。机器视觉虽然在学科分类上与计算机视觉认定为人工智能领域,但机器视觉更多的专注于广义的图像信号处理(激光、摄像头)和自动化控制(生产线)方面的应用。而对于计算机视觉更多注重图像信号本身的研究以及和图像相关的交叉学科研究(医学图像分析、地图导航)。因此在向机器视觉学习的过程中还需要继续学习集成控制、物理学、图像获取(摄像学,影像学)、生物学、数学、机器学习。
机器视觉可能涉及到的学科,图源《Wikipedia 维基百科》
基于视觉传感的检测方法主要可分为基于显示特征提取的检测方法和基于深度学习的检测方法。
基于显式特征提取的检测方法一般遵循图像预处理、特征提取、特征选择、特征分类的技术路线。在图像预处理阶段主要是对图像进行滤波、增强和边缘检测等操作。在特征提取阶段主要是从几何、色彩和梯度空间提取的尺寸、像素和纹理特征。在特征选择阶段主要通过主成分分析、独立成分分析等算法对特征维度进行降维。在特征识别阶段主要通过支持向量机、逻辑回归和感知机等方法对特征模式进行识别,进而完成的分类。由于基于显式特征提取的检测方法其特征识别的全过程由人工设计,然而,过高的人工参与程度导致无法充分利用大样本数据的信息,使分类识别效果的优劣严重依赖专家水平。同时,复杂的模型往往导致难以实现全局最优3。
近年来随着深度学习与计算机视觉的融合,使得机器视觉在检测能力上进一步得到了提高。简单来说,深度学习最常见的应用场景包括:
一个完整的机器视觉系统的主要工作过程如下:
工件定位传感器探测到物体已经运动至接近摄像系统的视野中心,向图像采集单元发送触发脉冲;
归纳起来机器视觉系统包含以下内容:
①图像采集:光学系统采集图像,图像转换成数字格式并传入计算机存储器。
②图像处理:处理器运用不同的算法来提高对检测有重要影响的图像像素。
③特征提取:处理器识别并量化图像的关键特征,例如位置、数量、面积等。然后这些数据传送到控制程序。
④判决和控制:处理器的控制程序根据接收到的数据做出结论。例如:位置是否合乎规格,或者执行机构如何移动去拾取某个部件。
广义的视觉传感器主要由光源、镜头、图像传感器、模数转换器、图像处理器、图像存储器等组成。
狭义的视觉传感器是指图像传感器,它的作用是将镜头所成的图像转变为数字或模拟信号输出,是视觉检测的核心部件,主要有CCD图像传感器和CMOS图像传感器。
CCD (Charge-Coupled Device)中文全称为电荷耦合元件。CCD图像传感器主要是由一个类似马赛克的网格、聚光镜片以及垫于最底下的电子线路矩阵所组成,其外形如图所示。
CCD是一种特殊的半导体器件,能够把光学影像转化为数字信号。CCD上植入的微小光敏物质称作像素。一块CCD上包含的像素数越多,它提供的画面分辨率也就越高。CCD的作用就像胶片一样,但它是把光信号转换成电荷信号。CCD上有许多排列整齐的光电二极管,能感应光线,并将光信号转变成电信号,经外部采样放大及模数转换电路转换成数字图像信号。
由于CCD 的体积小、成本低,所以广泛应用于扫描仪、数码相机及数码摄像机中。目前大多数数码相机采用的视觉传感器都是CCD。
CMOS(ComplementaryMetal-Oxide Semiconductor)中文全称为互补性氧化金属半导体。CMOS图像传感器是利用CMOS工艺制造的图像传感器,主要利用了半导体的光电效应,和CCD的原理相同,其外形如图所示。
CMOS图像传感器与CCD图像传感器一样,可用于自动控制、自动测量、摄影摄像、视觉识别等各个领域。
CCD和CMOS图像传感器具有以下差异。
用以下表格对两者差异进行比较。
对比维度 | CCD(电荷耦合器件) | CMOS(互补金属氧化物半导体) |
---|---|---|
| 集成在半导体单晶材料上 | 集成在金属氧化物半导体材料上 |
| 从阵列角落顺序读取电荷信号(被动电荷转移) | 每个像素通过有源像素传感器(APS)主动输出信号 |
| 连续扫描,信号放大在扫描完成后统一处理 | 每个像素独立放大电荷信号(并行处理) |
| 像素结构简单,感光区域占比大,感光度较高 | 像素集成放大器与A/D电路,感光区域压缩,感光度较低 |
| 感光开口较大,相同尺寸下分辨率更优 | 像素结构复杂,感光开口较小,分辨率相对较低 |
| 单一放大器设计,噪声控制更优 | 百万级独立放大器存在微小差异,噪声累积效应显著 |
| 需独立传输通道和外加ADC,良率低,成本高 | MOS制程集成度高,周边设施整合,成本更低 |
| 被动电荷转移需12V以上高压,电源设计复杂,耗电高 | 主动式晶体管驱动,低压操作,功耗显著降低 |
CCD摄像机和CMOS摄像机在使用过程还涉及诸多工作参数。就当前技术现状,CCD摄像机的灵敏度和解析度均比CMOS高,为了能够确保视觉识别的精度和准确度,一般选用CCD摄像机作为图像传感器。
CCD和CMOS图像传感器的主要参数有像素、帧率、靶面尺寸、感光度、信噪比和电子快门等。
用以下表格对主要参数进行汇总。
参数 | 定义 | 作用与影响 | 典型值/示例 |
---|---|---|---|
像素 | 图像传感器上的感光单元数量,每个单元对应一个像素 | 像素越高,能捕捉的细节越多,图像越清晰 | 常见:2MP(200万像素)、5MP、12MP等 |
帧率 | 单位时间内(每秒)记录或播放的图像数量 | 帧率越高,视频越流畅;15fps 以上人眼不易察觉卡顿,24~30fps 基本无闪烁 | 监控常用:15fps、30fps;高速摄像:60fps、120fps+ |
靶面尺寸 | 传感器感光区域的对角线尺寸(通常以英寸表示) | 靶面越大,通光量越好,低光性能更佳;靶面越小,景深越大 | 常见:1/3"、1/2"、1/4" |
感光度 | 传感器对入射光线的敏感程度 | 感光度越高,低光环境下成像能力越强,快门速度可更快;但过高可能引入噪点 | ISO 100~6400(或更高) |
信噪比(SNR) | 信号电压与噪声电压的比值(单位:dB) | 信噪比越高,图像噪声越小,画质越纯净;45~55dB:图像良好;60dB+:图像优质 | 典型范围:45~60dB |
电子快门 | 控制传感器感光时间的电子机制 | 快门越快,曝光时间越短,适合强光或高速运动拍摄;快门越慢,感光时间越长,适合弱光环境 | 范围:1/1000s ~ 1s+ |
需要构建一套机器视觉系统,就必须要考虑需要多少像素的相机以及配套的镜头。(如果预算足够其实越贵越好)以下是根据实际场景需要进行相机及对应镜头的选择。(也可以借鉴视频,以下是知识搬运8)
希望在一个100x100 毫米的产品上进行尺寸测量,工作距离为50厘米,并且要求测量误差在0.02毫米以内,根据这些要求来选择合适的相机分辨率及镜头选择:
1.计算最小可测量尺寸:
考虑到误差要求为0.02毫米以内,需要相机能够捕捉到这个误差。因此,最小可测量尺寸为:最小可测量尺寸0.01mm
2.确定相机的视场大小:
在工作距离为50厘米的情况下,计算相机在物体上的视场大小,以确保整个物体都在图像中可见。利用三角形原理:
视场大小=物体尺寸*工作距离/实际物距=100mmx50cm/50cm=100 mm(其中物距为工作距离+镜头长度,此处不考虑镜头长度)
3.计算相机分辨率:
根据视场大小和最小可测量尺寸,可以计算所需的相机分辨率:相机分辨率=视场大小/最小可测量尺寸=100mm/0.01mm=10000,这个是理论值实际中还要除以(3至5)个像素,一般除以3基本够用10000/3=3333.333(选个两千万足够了)
因此,为了满足在工作距离为50厘米下,能够测量 100x100 毫米的产品尺寸并且误差要求在 0.02毫米以内,要选择一个具有至少5000x5000像素分辨率的相机。
已知相机的前提下再进行镜头的测算,目前已有相关网站提供计算办法9。
首先进入网站后,如图所示选择合适的相机像素,点击下一步
在第二步填入对应的数据并搜索即可得到测算出来的镜头焦距
根据镜头焦距选择合适的厂商进行购买。
参考文献
1 穆向阳, 张太镒. 机器视觉系统的设计J. 西安石油大学学报(自然科学版), 2007(06):104-109.
2 赵鹏. 机器视觉理论及应用M. Dian zi gong ye chu ban she, 2011.
3 刘天元, 郑杭彬, 杨长祺, 等. 面向激光焊接缺陷识别的可解释性深度学习方法J. 航空学报, 2022,43(04):451-460.
4 黄鹏, 郑淇, 梁超. 图像分割方法综述J. 武汉大学学报(理学版), 2020,66(06):519-531.
5 吕昊远, 俞璐, 周星宇, 等. 半监督深度学习图像分类方法研究综述J. 计算机科学与探索, 2021,15(06):1038-1048.
6 https://www.cidp.com.cn/web/otherUnit/9ac08cab3f2645dea0918a0d4fa5c2d1/gcjx
7 https://www.cidp.com.cn/web/KnowledgeUnit/1f9beaf1ab5441dfb583c720fb6c06fa
9 https://www.coolens.cn/support/004006.html?pathindese3rmd
原文地址:https://mp.weixin.qq.com/s/vf6QgOzGckxzNpXRthwHPA
2025年4月5日 第3期
图文:渴望
审核:EatRicer
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有