首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >学习SVM(一) SVM模型训练与分类的OpenCV实现

学习SVM(一) SVM模型训练与分类的OpenCV实现

作者头像
chaibubble
发布于 2022-05-07 01:32:06
发布于 2022-05-07 01:32:06
1.7K0
举报

简介

学习SVM(一) SVM模型训练与分类的OpenCV实现

学习SVM(二) 如何理解支持向量机的最大分类间隔

学习SVM(三)理解SVM中的对偶问题

学习SVM(四) 理解SVM中的支持向量(Support Vector)

学习SVM(五)理解线性SVM的松弛因子

Andrew Ng 在斯坦福大学的机器学习公开课上这样评价支持向量机:

support vector machines is the supervised learning algorithm that many people consider the most effective off-the-shelf supervised learning algorithm.That point of view is debatable,but there are many people that hold that point of view.

可见,在监督学习算法中支持向量机有着非常广泛的应用,而且在解决图像分类问题时有着优异的效果。

OpenCV集成了这种学习算法,它被包含在ml模块下的CvSVM类中,下面我们用OpenCV实现SVM的数据准备模型训练加载模型实现分类,为了理解起来更加直观,我们用三个工程来实现。

数据准备

在OpenCV的安装路径下,搜索digits,可以得到一张图片,图片大小为1000_2000,有0-9的10个数字,每5行为一个数字,总共50行,共有5000个手写数字,每个数字块大小为20_20。 下面将把这些数字中的0和1作为二分类的准备数据。其中0有500张,1有500张。

用下面的代码将图片准备好,在写入路径提前建立好文件夹:

代码语言:javascript
AI代码解释
复制
#include <opencv2/opencv.hpp>
#include <iostream>

using namespace std;
using namespace cv;

int main()
{
	char ad[128]={0};
	int  filename = 0,filenum=0; 
	Mat img = imread("digits.png");
	Mat gray;
	cvtColor(img, gray, CV_BGR2GRAY);
	int b = 20;
	int m = gray.rows / b;   //原图为1000*2000
	int n = gray.cols / b;   //裁剪为5000个20*20的小图块

	for (int i = 0; i < m; i++)
	{
		int offsetRow = i*b;  //行上的偏移量
		if(i%5==0&&i!=0)
		{
			filename++;
			filenum=0;
		}
		for (int j = 0; j < n; j++)
		{
			int offsetCol = j*b; //列上的偏移量
			sprintf_s(ad, "D:\\data\\%d\\%d.jpg",filename,filenum++);
			//截取20*20的小块
			Mat tmp;
			gray(Range(offsetRow, offsetRow + b), Range(offsetCol, offsetCol + b)).copyTo(tmp);
			imwrite(ad,tmp);
		}
	}
	return 0;
}

最后可以得到这样的结果:

组织的二分类数据形式为:

代码语言:javascript
AI代码解释
复制
--D--data
    --train_image
      --0400张)
      --1400张)
    --test_image
      --0100张)
      --1100张)

训练数据800张,0,1各400张;测试数据200张,0,1各100张

模型训练

数据准备完成之后,就可以用下面的代码训练了:

代码语言:javascript
AI代码解释
复制
#include <stdio.h>  
#include <time.h>  
#include <opencv2/opencv.hpp>  
#include <opencv/cv.h>  
#include <iostream> 
#include <opencv2/core/core.hpp>  
#include <opencv2/highgui/highgui.hpp>  
#include <opencv2/ml/ml.hpp>  
#include <io.h>

using namespace std;
using namespace cv;

void getFiles( string path, vector<string>& files);
void get_1(Mat& trainingImages, vector<int>& trainingLabels);
void get_0(Mat& trainingImages, vector<int>& trainingLabels);

int main()
{
	//获取训练数据
	Mat classes;
	Mat trainingData;
	Mat trainingImages;
	vector<int> trainingLabels;
	get_1(trainingImages, trainingLabels);
	get_0(trainingImages, trainingLabels);
	Mat(trainingImages).copyTo(trainingData);
	trainingData.convertTo(trainingData, CV_32FC1);
	Mat(trainingLabels).copyTo(classes);
	//配置SVM训练器参数
	CvSVMParams SVM_params;
	SVM_params.svm_type = CvSVM::C_SVC;
	SVM_params.kernel_type = CvSVM::LINEAR; 
	SVM_params.degree = 0;
	SVM_params.gamma = 1;
	SVM_params.coef0 = 0;
	SVM_params.C = 1;
	SVM_params.nu = 0;
	SVM_params.p = 0;
	SVM_params.term_crit = cvTermCriteria(CV_TERMCRIT_ITER, 1000, 0.01);
	//训练
	CvSVM svm;
	svm.train(trainingData, classes, Mat(), Mat(), SVM_params);
	//保存模型
	svm.save("svm.xml");
	cout<<"训练好了!!!"<<endl;
	getchar();
	return 0;
}
void getFiles( string path, vector<string>& files )  
{  
	long   hFile   =   0;  
	struct _finddata_t fileinfo;  
	string p;  
	if((hFile = _findfirst(p.assign(path).append("\\*").c_str(),&fileinfo)) !=  -1)  
	{  
		do  
		{  
			if((fileinfo.attrib &  _A_SUBDIR))  
			{  
				if(strcmp(fileinfo.name,".") != 0  &&  strcmp(fileinfo.name,"..") != 0)  
					getFiles( p.assign(path).append("\\").append(fileinfo.name), files );  
			}  
			else  
			{  
				files.push_back(p.assign(path).append("\\").append(fileinfo.name) );  
			}  
		}while(_findnext(hFile, &fileinfo)  == 0);  

		_findclose(hFile);  
	}  
} 
void get_1(Mat& trainingImages, vector<int>& trainingLabels)
{
	char * filePath = "D:\\data\\train_image\\1"; 
	vector<string> files;  
	getFiles(filePath, files );  
	int number = files.size();  
	for (int i = 0;i < number;i++)  
	{  
		Mat  SrcImage=imread(files[i].c_str());
		SrcImage= SrcImage.reshape(1, 1);
		trainingImages.push_back(SrcImage);
		trainingLabels.push_back(1);
	}  
}
void get_0(Mat& trainingImages, vector<int>& trainingLabels)
{
	char * filePath = "D:\\data\\train_image\\0"; 
	vector<string> files;  
	getFiles(filePath, files );  
	int number = files.size();  
	for (int i = 0;i < number;i++)  
	{  
		Mat  SrcImage=imread(files[i].c_str());
		SrcImage= SrcImage.reshape(1, 1);
		trainingImages.push_back(SrcImage);
		trainingLabels.push_back(0);
	}  
}

整个训练过程可以分为一下几个部分:

数据准备:

该例程中一个定义了三个子程序用来实现数据准备工作:

getFiles()用来遍历文件夹下所有文件,可以参考:

http://blog.csdn.net/chaipp0607/article/details/53914954

getBubble()用来获取有气泡的图片和与其对应的Labels,该例程将Labels定为1。

getNoBubble()用来获取没有气泡的图片与其对应的Labels,该例程将Labels定为0。

getBubble()与getNoBubble()将获取一张图片后会将图片(特征)写入到容器中,紧接着会将标签写入另一个容器中,这样就保证了特征和标签是一一对应的关系push_back(0)或者push_back(1)其实就是我们贴标签的过程。

代码语言:javascript
AI代码解释
复制
trainingImages.push_back(SrcImage);
trainingLabels.push_back(0);

在主函数中,将getBubble()与getNoBubble()写好的包含特征的矩阵拷贝给trainingData,将包含标签的vector容器进行类型转换后拷贝到trainingLabels里,至此,数据准备工作完成,trainingData与trainingLabels就是我们要训练的数据。

代码语言:javascript
AI代码解释
复制
	Mat classes;
	Mat trainingData;
	Mat trainingImages;
	vector<int> trainingLabels;
	getBubble(trainingImages, trainingLabels);
	getNoBubble(trainingImages, trainingLabels);
	Mat(trainingImages).copyTo(trainingData);
	trainingData.convertTo(trainingData, CV_32FC1);
	Mat(trainingLabels).copyTo(classes);

特征选取

其实特征提取和数据的准备是同步完成的,我们最后要训练的也是正负样本的特征。本例程中同样在getBubble()与getNoBubble()函数中完成特征提取工作,只是我们简单粗暴将整个图的所有像素作为了特征,因为我们关注更多的是整个的训练过程,所以选择了最简单的方式完成特征提取工作,除此中外,特征提取的方式有很多,比如LBP,HOG等等。

代码语言:javascript
AI代码解释
复制
  SrcImage= SrcImage.reshape(1, 1);

我们利用reshape()函数完成特征提取,原型如下:

代码语言:javascript
AI代码解释
复制
 Mat reshape(int cn, int rows=0) const;

可以看到该函数的参数非常简单,cn为新的通道数,如果cn = 0,表示通道数不会改变。参数rows为新的行数,如果rows = 0,表示行数不会改变。我们将参数定义为reshape(1, 1)的结果就是原图像对应的矩阵将被拉伸成一个一行的向量,作为特征向量。

参数配置

参数配置是SVM的核心部分,在Opencv中它被定义成一个结构体类型,如下:

代码语言:javascript
AI代码解释
复制
struct CV_EXPORTS_W_MAP CvSVMParams
{
    CvSVMParams();
    CvSVMParams(  
    int svm_type, 
    int kernel_type,
    double degree, 
    double coef0,
    double Cvalue, 
    double p,
    CvMat* class_weights, 
    CvTermCriteria term_crit );
    CV_PROP_RW int         svm_type;
    CV_PROP_RW int         kernel_type;
    CV_PROP_RW double      degree; // for poly
    CV_PROP_RW double      gamma;  // for poly/rbf/sigmoid
    CV_PROP_RW double      coef0;  // for poly/sigmoid
    CV_PROP_RW double      C;  // for CV_SVM_C_SVC,       CV_SVM_EPS_SVR and CV_SVM_NU_SVR
    CV_PROP_RW double      nu; // for CV_SVM_NU_SVC, CV_SVM_ONE_CLASS, and CV_SVM_NU_SVR
    CV_PROP_RW double      p; // for CV_SVM_EPS_SVR
    CvMat*      class_weights; // for CV_SVM_C_SVC
    CV_PROP_RW CvTermCriteria term_crit; // termination criteria
};

所以在例程中我们定义了一个结构体变量用来配置这些参数,而这个变量也就是CVSVM类中train函数的第五个参数,下面对参数进行说明。

SVM_params.svm_type :SVM的类型:

C_SVC表示SVM分类器,C_SVR表示SVM回归

SVM_params.kernel_type:核函数类型

线性核LINEAR:

d(x,y)=(x,y)

多项式核POLY:

d(x,y)=(gamma*(x’y)+coef0)degree

径向基核RBF:

d(x,y)=exp(-gamma*|x-y|^2)

sigmoid核SIGMOID:

d(x,y)= tanh(gamma*(x’y)+ coef0)

SVM_params.degree:核函数中的参数degree,针对多项式核函数;

SVM_params.gama:核函数中的参数gamma,针对多项式/RBF/SIGMOID核函数;

SVM_params.coef0:核函数中的参数,针对多项式/SIGMOID核函数;

SVM_params.c:SVM最优问题参数,设置C-SVCEPS_SVRNU_SVR的参数;

SVM_params.nu:SVM最优问题参数,设置NU_SVCONE_CLASSNU_SVR的参数;

SVM_params.p:SVM最优问题参数,设置EPS_SVR 中损失函数p的值.

训练模型

代码语言:javascript
AI代码解释
复制
CvSVM svm;
svm.train(trainingData, classes, Mat(), Mat(), SVM_params);

通过上面的过程,我们准备好了待训练的数据和训练需要的参数,**其实可以理解为这个准备工作就是在为svm.train()函数准备实参的过程。**来看一下svm.train()函数,Opencv将SVM封装成CvSVM库,这个库是基于台湾大学林智仁(Lin Chih-Jen)教授等人开发的LIBSVM封装的,由于篇幅限制,不再全部粘贴库的定义,所以一下代码只是CvSVM库中的一部分数据和函数:

代码语言:javascript
AI代码解释
复制
class CV_EXPORTS_W CvSVM : public CvStatModel
{
public:
virtual bool train( 
  const CvMat* trainData, 
  const CvMat* responses,
  const CvMat* varIdx=0, 
  const CvMat* sampleIdx=0,
  CvSVMParams params=CvSVMParams() );
virtual float predict( 
  const CvMat* sample, 
  bool returnDFVal=false ) const;

我们就是应用类中定义的train函数完成模型训练工作。

保存模型

代码语言:javascript
AI代码解释
复制
svm.save("svm.xml");

保存模型只有一行代码,利用save()函数,我们看下它的定义:

代码语言:javascript
AI代码解释
复制
    CV_WRAP virtual void save( const char* filename, const char* name=0 ) const;

该函数被定义在CvStatModel类中,CvStatModel是ML库中的统计模型基类,其他 ML 类都是从这个类中继承。

**总结:**到这里我们就完成了模型训练工作,可以看到真正用于训练的代码其实很少,OpenCV最支持向量机的封装极大地降低了我们的编程工作。

加载模型实现分类

代码语言:javascript
AI代码解释
复制
#include <stdio.h>  
#include <time.h>  
#include <opencv2/opencv.hpp>  
#include <opencv/cv.h>  
#include <iostream> 
#include <opencv2/core/core.hpp>  
#include <opencv2/highgui/highgui.hpp>  
#include <opencv2/ml/ml.hpp>  
#include <io.h>

using namespace std;
using namespace cv;

void getFiles( string path, vector<string>& files );

int main()
{
	int result = 0;
	char * filePath = "D:\\data\\test_image\\0"; 
	vector<string> files;  
	getFiles(filePath, files );  
	int number = files.size();  
	cout<<number<<endl;
	CvSVM svm;
	svm.clear();
	string modelpath = "svm.xml";
	FileStorage svm_fs(modelpath,FileStorage::READ);
	if(svm_fs.isOpened())
	{
		svm.load(modelpath.c_str());
	}
	for (int i = 0;i < number;i++)  
	{  
		Mat inMat = imread(files[i].c_str());
		Mat p = inMat.reshape(1, 1);
		p.convertTo(p, CV_32FC1);
		int response = (int)svm.predict(p);
		if (response == 0)
		{
			result++;
		}
	}
	cout<<result<<endl;
	getchar();
	return  0;
}
void getFiles( string path, vector<string>& files )  
{  
	long   hFile   =   0;  
	struct _finddata_t fileinfo;  
	string p;  
	if((hFile = _findfirst(p.assign(path).append("\\*").c_str(),&fileinfo)) !=  -1)  
	{  
		do  
		{  
			if((fileinfo.attrib &  _A_SUBDIR))  
			{  
				if(strcmp(fileinfo.name,".") != 0  &&  strcmp(fileinfo.name,"..") != 0)  
					getFiles( p.assign(path).append("\\").append(fileinfo.name), files );  
			}  
			else  
			{  		files.push_back(p.assign(path).append("\\").append(fileinfo.name) );  
			}  
		}while(_findnext(hFile, &fileinfo)  == 0);  
		_findclose(hFile);  
	}  
} 

在上面我们把该介绍的都说的差不多了,这个例程中只是用到了load()函数用于模型加载,加载的就是上面例子中生成的模型,load()被定义在CvStatModel这个基类中:

代码语言:javascript
AI代码解释
复制
	svm.load(modelpath.c_str());

load的路径是string modelpath = "svm.xml",这意味着svm.mxl文件应该在测试工程的根目录下面,但是因为训练和预测是两个独立的工程,所以必须要拷贝一下这个文件。最后用到predict()函数用来预测分类结果,predict()被定义在CVSVM类中。

注意:

1.为什么要建立三个独立的工程呢?

主要是考虑写在一起话,代码量会比较大,逻辑没有分开清晰,当跑通上面的代码之后,就可以随意的改了。

2.为什么加上数据准备?

之前有评论说道数据的问题,提供数据后实验能更顺利一些,因为本身代码没有什么含金量,这样可以更顺利的运行起来工程,并修改它。

3.一些容易引起异常的情况:

(1):注意生成的.xml记得拷贝到预测工程下;

(2):注意准备好数据路径和代码是不是一致;

(3):注意训练的特征要和测试的特征一致;

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2017-03-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
使用python的pyecharts库绘制数据可视化大屏
今天有位职场的人员询问我可不可以做一个汇报销售工作进展的数据可视化大屏,我最近刚好学了这个pyecharts库,利用它我们可以绘制一个完美的数据可视化大屏,最终结果如下图形和视频:那么这么完美的效果是怎么呈现的呢,接下来我们便开始绘制这样的数字可视化大屏。
你像时光唯美i
2022/08/26
1.9K0
使用python的pyecharts库绘制数据可视化大屏
用 Pyecharts 制作炫酷的可视化大屏
作者 | 俊欣 来源 | 关于数据分析与可视化 前两篇Pyecharts的文章来帮我们简单的梳理了一下可以用Pyecharts来绘制哪些图表之后,本篇文章我们用pyecharts里面的一些组件,将绘制的图表都组合起来 首先Grid组件 首先介绍Pyecharts模块当中的Grid组件,使用Grid组件可以很好地将多张图无论是上下组合还是左右组合,都能够很好地拼接起来,我们先来看第一个例子 bar = ( Bar() .add_xaxis(Fak
AI科技大本营
2023/04/14
1.1K0
用 Pyecharts 制作炫酷的可视化大屏
干货 | 使用pyecharts绘制交互式动态地图
说到pyecharts,相信很多人不会陌生,一个优秀的python可视化包。 pyecharts是中国人开发的,相比较matplotlib、seaborn等老牌可视化库,pyecharts是十分符合国内用户习惯的,尤其在地理空间图表方面。 本文是想试探一下pyecharts在绘制地理图表方面的功底如何,那就开始吧!
派大星的数据屋
2022/04/02
1.5K0
干货 | 使用pyecharts绘制交互式动态地图
python+echarts可视化—pyecharts
pyecharts是一个用于生成Echarts 图表的python库。Echarts(https://echarts.apache.org/examples/zh/index.html )是一个数据可视化JS库,做出来的图非常好看。pyecharts这个项目可以在python中也生成这种风格的图。具体效果图可以参见该网站https://pyecharts.herokuapp.com/。
生信编程日常
2020/04/01
1.5K0
python+echarts可视化—pyecharts
拥有圆圆脸蛋的饼图小可爱前来报道!
小编已经带大家绘制过柱状图,折线图,大家肯定对我们的 PyEcharts 有了一些了解,对其他图形的绘制也跃跃欲试,不要着急,今天我们就来看看圆圆脸蛋的饼图是怎么来的吧!
数据山谷
2020/12/22
4860
python pyecharts数据可视化 玫瑰图、柱形图、饼图、环图
其实真正能让自己走远的,都是自律、积极和勤奋。 文章目录 一、柱形图 代码如下: from pyecharts.charts import Bar from pyecharts.faker import Faker from pyecharts.globals import ThemeType, CurrentConfig from pyecharts import options as opts CurrentConfig.ONLINE_HOST = 'D:/python/pyecharts-a
叶庭云
2020/09/17
12.7K0
python  pyecharts数据可视化   玫瑰图、柱形图、饼图、环图
这几个用 Pyecharts 做出来的交互图表,领导说叼爆了!
编辑 | JackTian 来源 | 杰哥的IT之旅(ID:Jake_Internet) 转载请联系授权(微信ID:Hc220066)
杰哥的IT之旅
2020/09/22
2K0
这几个用 Pyecharts 做出来的交互图表,领导说叼爆了!
excel绘制南丁格尔玫瑰图过于复杂,试试用python绘制南丁格尔玫瑰图!
前面向大家讲解了如何用excel绘制高大上的南丁格尔玫瑰图,对于经常用excel的人来说,其实是简单的,但经常用python来绘制图表的人,怎么会用excel来绘制自己想要的图表呢!所以今天教大家如何用python绘制南丁格尔玫瑰图。
Python与Excel之交
2021/08/05
1.5K0
pyecharts全家桶,一招学会python可视化
pyecharts一直被誉为python可视化的神器,因为它只需较少的代码既可以绘制非常漂亮的图形
龙哥
2021/01/25
1.2K0
pyecharts全家桶,一招学会python可视化
Pyecharts进阶篇
本章节,我们会使用全国空气质量数据呈现中国地图,还会使用全球各个国家或地区GDP数据绘制全球地图。
@小森
2024/06/28
2900
Pyecharts进阶篇
【Python可视化】超详细Pyecharts 1.x教程,让你的图表动起来~
pyecharts 是一个用于生成 Echarts 图表的Python库。Echarts是百度开源的一个数据可视化 JS 库,可以生成一些非常酷炫的图表。
Awesome_Tang
2020/02/25
3.2K0
【Python可视化】超详细Pyecharts 1.x教程,让你的图表动起来~
Python Geo 地图
参考:# https://github.com/pyecharts/pyecharts/blob/master/example/geo_example.py
Java架构师必看
2021/08/09
9240
pyecharts-14-页面组件Page
Pyecharts有一个非常强大的功能,就是能够将多个图形同时放在一个HTML页面中。这种方式和其他库的绘制多个子图的方式的区别在于:Pyecharts中能够自定义位置和图形大小。
皮大大
2021/03/01
4.6K1
分析Python招聘数据,可视化展示招聘信息详情
通过开发者工具进行抓包分析 I. 打开开发者工具: F12 / 右键点击检查选择network 暂时可能没有数据包或者数据包比较少 <数据不完整> II. 刷新网页: 让数据内容重新加载一遍 III. 通过关键字去搜索查询对应数据包 关键字: 我们需要的数据
松鼠爱吃饼干
2023/09/02
6870
分析Python招聘数据,可视化展示招聘信息详情
票房20亿,豆瓣7.0?Python分析电影《孤注一掷》豆瓣评论数据
松鼠爱吃饼干
2023/09/02
4620
票房20亿,豆瓣7.0?Python分析电影《孤注一掷》豆瓣评论数据
python可视化利器:pyecharts
前面我们提及ggplot在R和Python中都是数据可视化的利器,在机器学习和数据分析领域得到了广泛的应用。pyecharts结合了Python和百度开源的Echarts工具,基于其交互性和便利性得到了众多开发者的认可。拥有如下的特点:
TOMOCAT
2020/06/10
1.8K0
pyecharts-6-绘制地图
当绘制具体某个省份的地图时候,需要在地级市后面加上一个\color{red}{市},否则不能出图:
皮大大
2021/03/01
1.3K0
pyecharts-6-绘制地图
Pyecharts入门
Apache ECharts 是一个由百度开源的数据可视化,凭借着良好的交互性,精巧的图表设计,得到了众多开发者的认可。而 Python 是一门富有表达力的语言,很适合用于数据处理。当数据分析遇上数据可视化时,pyecharts 诞生了;PyEcharts是Echarts的Python接口, Pyecharts = Python + Echarts
@小森
2024/06/28
5030
Pyecharts入门
pyecharts-5-绘制柱状图
Pyecharts-5-绘制柱状图Bar 本文中介绍的是如何利用pyecharts中绘制各种bar柱状图。 主要是参考官网的各种例子进行学习和整理 导入各种库 from pyecharts impor
皮大大
2021/03/01
8740
pyecharts-5-绘制柱状图
pyecharts-13-绘制漏斗图
漏斗图在电商领域中观察用户转化率的情形使用非常普遍,本文通过一个模拟的商城用户行为的例子来绘制漏斗图
皮大大
2021/03/01
2.9K0
推荐阅读
相关推荐
使用python的pyecharts库绘制数据可视化大屏
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档