原文 OpenCV实现KNN算法

K Nearest Neighbors

这个算法首先贮藏所有的训练样本,然后通过分析(包括选举,计算加权和等方式)一个新样本周围K个最近邻以给出该样本的相应值。这种方法有时候被称作“基于样本的学习”,即为了预测,我们对于给定的输入搜索最近的已知其相应的特征向量。

class CvKNearest : public CvStatModel //继承自ML库中的统计模型基类
{
public: CvKNearest();//无参构造函数
virtual ~CvKNearest(); //虚函数定义 CvKNearest( const CvMat* _train_data, const CvMat* _responses,
const CvMat* _sample_idx=, bool _is_regression=false, int max_k= );//有参构造函数 virtual bool train( const CvMat* _train_data, const CvMat* _responses,
const CvMat* _sample_idx=, bool is_regression=false,
int _max_k=, bool _update_base=false ); virtual float find_nearest( const CvMat* _samples, int k, CvMat* results,
const float** neighbors=, CvMat* neighbor_responses=, CvMat* dist= ) const; virtual void clear();
int get_max_k() const;
int get_var_count() const;
int get_sample_count() const;
bool is_regression() const; protected:
...
};

CvKNearest::train

训练KNN模型

bool CvKNearest::train( const CvMat* _train_data, const CvMat* _responses,
const CvMat* _sample_idx=, bool is_regression=false,
int _max_k=, bool _update_base=false );

这个类的方法训练K近邻模型。它遵循一个一般训练方法约定的限制:只支持CV_ROW_SAMPLE数据格式,输入向量必须都是有序的,而输出可以 是 无序的(当is_regression=false),可以是有序的(is_regression=true)。并且变量子集和省略度量是不被支持的。

参数_max_k 指定了最大邻居的个数,它将被传给方法find_nearest。 参数 _update_base 指定模型是由原来的数据训练(_update_base=false),还是被新训练数据更新后再训练(_update_base=true)。在后一种情况下_max_k 不能大于原值, 否则它会被忽略.

CvKNearest::find_nearest

寻找输入向量的最近邻

float CvKNearest::find_nearest( const CvMat* _samples, int k, CvMat* results=,
const float** neighbors=, CvMat* neighbor_responses=, CvMat* dist= ) const;

对每个输入向量(表示为matrix_sample的每一行),该方法找到k(k≤get_max_k() )个最近邻。在回归中,预测结果将是指定向量的近邻的响应的均值。在分类中,类别将由投票决定。

对传统分类和回归预测来说,该方法可以有选择的返回近邻向量本身的指针(neighbors, array of k*_samples->rows pointers),它们相对应的输出值(neighbor_responses, a vector of k*_samples->rows elements) ,和输入向量与近邻之间的距离(dist, also a vector of k*_samples->rows elements)。

对每个输入向量来说,近邻将按照它们到该向量的距离排序。

对单个输入向量,所有的输出矩阵是可选的,而且预测值将由该方法返回。

例程:使用kNN进行2维样本集的分类,样本集的分布为混合高斯分布

#include "ml.h"
#include "highgui.h" int main( int argc, char** argv )
{
const int K = ;
int i, j, k, accuracy;
float response;
int train_sample_count = ;
CvRNG rng_state = cvRNG(-);
CvMat* trainData = cvCreateMat( train_sample_count, , CV_32FC1 );
CvMat* trainClasses = cvCreateMat( train_sample_count, , CV_32FC1 );
IplImage* img = cvCreateImage( cvSize( , ), , );
float _sample[];
CvMat sample = cvMat( , , CV_32FC1, _sample );
cvZero( img ); CvMat trainData1, trainData2, trainClasses1, trainClasses2; // form the training samples
cvGetRows( trainData, &trainData1, , train_sample_count/ );
cvRandArr( &rng_state, &trainData1, CV_RAND_NORMAL, cvScalar(,), cvScalar(,) ); cvGetRows( trainData, &trainData2, train_sample_count/, train_sample_count );
cvRandArr( &rng_state, &trainData2, CV_RAND_NORMAL, cvScalar(,), cvScalar(,) ); cvGetRows( trainClasses, &trainClasses1, , train_sample_count/ );
cvSet( &trainClasses1, cvScalar() ); cvGetRows( trainClasses, &trainClasses2, train_sample_count/, train_sample_count );
cvSet( &trainClasses2, cvScalar() ); // learn classifier
CvKNearest knn( trainData, trainClasses, , false, K );
CvMat* nearests = cvCreateMat( , K, CV_32FC1); for( i = ; i < img->height; i++ )
{
for( j = ; j < img->width; j++ )
{
sample.data.fl[] = (float)j;
sample.data.fl[] = (float)i; // estimates the response and get the neighbors' labels
response = knn.find_nearest(&sample,K,,,nearests,); // compute the number of neighbors representing the majority
for( k = , accuracy = ; k < K; k++ )
{
if( nearests->data.fl[k] == response)
accuracy++;
}
// highlight the pixel depending on the accuracy (or confidence)
cvSet2D( img, i, j, response == ?
(accuracy > ? CV_RGB(,,) : CV_RGB(,,)) :
(accuracy > ? CV_RGB(,,) : CV_RGB(,,)) );
}
} // display the original training samples
for( i = ; i < train_sample_count/; i++ )
{
CvPoint pt;
pt.x = cvRound(trainData1.data.fl[i*]);
pt.y = cvRound(trainData1.data.fl[i*+]);
cvCircle( img, pt, , CV_RGB(,,), CV_FILLED );
pt.x = cvRound(trainData2.data.fl[i*]);
pt.y = cvRound(trainData2.data.fl[i*+]);
cvCircle( img, pt, , CV_RGB(,,), CV_FILLED );
} cvNamedWindow( "classifier result", );
cvShowImage( "classifier result", img );
cvWaitKey(); cvReleaseMat( &trainClasses );
cvReleaseMat( &trainData );
return ;
}

结果:

aaarticlea/png;base64," alt="" />

最新文章

  1. LeetCode: Largest Rectangle in Histogram(直方图最大面积)
  2. java学习笔记--IO流
  3. ELF(Executable and Linkable Format)
  4. 你不知道的JavaScript--数组进阶全掌握
  5. 在指定路径下查找并打印mdb类型文件
  6. 【翻译】使用CSS3和jQuery制作跟随鼠标方位的Hover特效
  7. NSS_08 extjs表单验证
  8. linux面试题2
  9. 使用VSS2005的时候报错:输入正确的服务器地址依然出错了
  10. 【Firefly API 新版文档】Package dbentrust
  11. xml2js
  12. office2010安装出错,windows installer服务不能更新一个或多个受保护的windows文件
  13. JQuery是继prototype之后又一个优秀的Javascript库
  14. Swift2.3适配Swift3.0时出现的各种问题
  15. 同一台电脑使用 gitlab 和 github 配置
  16. hadoop 2.x 简单实现wordCount
  17. Address already in use: make_sock: could not bind to address 0.0.0.0:80
  18. Linux安装Tomcat-Nginx-FastDFS-Redis-Solr-集群——【第九集之安装Tomcat+Nginx反向代理Tomcat集群】
  19. IOS搜索框输入中文解决方案(防抖)
  20. SQL优化 - 避免使用 IN 和 NOT IN

热门文章

  1. 记事本写JAVA程序
  2. 【LOI2005】【P1306】河流
  3. 解决Ubuntu下vbox的(rc=-1908)
  4. 《Linux与Qt程序设计》知识框架
  5. show table status
  6. X-UA-Compatible设置兼容模式
  7. opsview
  8. Dubbo架构设计详解-转
  9. Javascript 去掉字符串前后空格的五种方法
  10. MATLAB中trapz和cumtrapz函数