5G即将商用,带宽提速,未来必将加快依赖宽带传输的图像和视频应用的产品市场化、普及化。
个人认为,图像和视频的分析和处理是人工智能几大基础理论支撑之一,项目中有些应用,但已经有好几年没有加强理论了,以下简单梳理和整理图像处理相关的基础知识,以备忘。
一、工具
很多,JAVA\C\C++\PYTHON等,可以使用python+opencv+pycharm,快速入门
二、图像的基本属性
通道、像素值、尺寸、位图深度
图像是视频某一时刻的某一帧
三、图像处理
1、颜色空间模型,比如RGB\HSV\YUV等。opencv处理是经常转换为HSV,HUE(色彩)、saturation(饱和度) 、value(值)
2、inrange通道分离和合并,用于对单一颜色物体的跟踪,见像素范围表
3、图像叠加cv.add、cv.substract、divide、multipl(加减乘除),平均mean、逻辑运算(与或非)、方差(分析无效图像)、标准差
4、RIO和泛洪填充,取矩阵像素一定范围替换填充
5、卷积,去噪,中值模糊去椒盐噪声、高斯模糊去高斯噪声、均值模糊、自定义模糊,锐化让图像更加清晰立体
6、 边缘保留滤波,用于美颜,EPF
7、图像直方图,可以应用与相同或相似图像查找,直方图反向投影
8、模板匹配,,用于将图中感兴趣区域找到
9、图像二值化:黑白两种,0黑色255白色,用于计算机识别中提高识别效率。超大图像二值化,分块、局部二值化更好
10、图像金字塔(降低分辨率、更容易存储和显示)
11、图像梯度(像素相减,用于边缘提取),一阶导数soble算子、二阶导数拉普拉斯算子,边缘提取canny
12、直线检测、圆检测(霍夫变换)
13、轮廓发现、对象测量
14、膨胀Dilate(减少或填充弱连接)与腐蚀Erode(分割或弱化连接)
15、开操作(去除小干扰块)闭操作(填充闭合区域),提取水平竖直线
16、黑帽、顶帽、图形学梯度,素描效果
17、基于分水岭的图像分割,Kmeans\高斯混合模型GMM等
以上都是基础知识(见下脑图),实际应用会有大量综合以上基础理论的成熟方法和算法,待续
领取专属 10元无门槛券
私享最新 技术干货