当前位置：文档库 › 用MatLab实现SVM分类

用MatLab实现SVM分类

在当前数据挖掘和机器学习领域，最为热门的话题莫过于SVM和Boosting方法了。只要是涉及到这两个主题，那么论文就会容易被杂志和会议接受了。看来不管做什么，都讲究眼球效应啊。搞研究其实也有点类似超级女声，呵呵。

以前我的论文中用的SVM Code都来自于台湾的林智仁教授的LibSVM。真的是佩服有些大家，自己做出了重要的发现和成果，想到的不是把自己的成果保密起来（像C4.5一样），让自己独享自己的成果；而是让自己的成果最大程度的被人所利用，给后来的研究人员打下一个坚实的基础。说实话，他的代码很好，用起来很方便，而且不同的语言版本实现都有，即使是对于初学者都很容易掌握。不过用的久了，我就想自己也实现SVM，现在的数学计算工具太多了，而且功能齐全，用起来方便。今天鼓捣了一会，终于用Matlab实现了第一个SVM。虽然比较简单，但是包含了大多数SVM的必要步骤。

这个实现是线性可分支持向量分类机，不考虑非线性分类引入核函数的情况，也不考虑推广条件下引入Penalty Loss的情况。

问题描述：平面上有如下点A = [1 1.5;2 1.5;3 1.5;4 1.5;1 0.5;2 0.5;3 0.5;4 0.5]及其对应的标号flag = [1 1 1 1 -1 -1 -1 -1];用SVM方法构造一个决策函数实现正确分类。

如果我们在二维坐标上描点，就会发现这是个很简单的线性可分问题。实现方法，用SVM 的对偶问题，转换为Matlab的有约束非线性规划问题。

构建m文件：

function f = ffsvm(x)

A = [1 1.5;2 1.5;3 1.5;4 1.5;1 0.5;2 0.5;3 0.5;4 0.5];

flag = [1 1 1 1 -1 -1 -1 -1];

for i=1:1:length(A)

for j=1:1:length(A)

normA(i,j) = A(i,:)*A(j,:)';

normFlag(i,j) = flag(1,i)*flag(1,j);

end

f = 0;

for i=1:1:length(A)

for j=1:1:length(A)

f = f + 1/2*(normA(i,j)*x(i)*x(j)*normFlag(i,j));

end

f = f - x(i);

end

在命令窗口输入：

Aeq = [1 1 1 1 -1 -1 -1 -1];

beq = 0;

lb = [ 0 0 0 0 0 0 0 0];

调用MatLab内置优化函数fmincon；

[x,favl,exitflag] = fmincon(@ffsvm,x0,[],[],Aeq,beq,lb,[])

得到如下结果：

Optimization terminated successfully:

Magnitude of directional derivative in search direction

less than 2*options.TolFun and maximum constraint violation

is less than options.TolCon

Active Constraints:

x =

0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000

favl =

-2.0000

exitflag =

x的分量都不为0，说明这些点都是支持向量；

计算w；

w = [0 0];

for i = 1:1:length(A)

w = w + flag(i)*x(i)*A(i,:);

end

结果：

w =[0,2];

计算b；

b = 0;

for i=1:1:8

b = b-flag(i)*x(i)*normA(i,1);

end

b = flag(1) + b；

结果：

b = -2;

最终的决策函数为：

f = sign([0, 2]*xT-2)

可以验证，这个学习到的决策函数能够对这些平面上的点实现很好的分类；

基本思路是这样的，如果要考虑引入核函数和Penalty Loss的情况，只需要修改优化函数和约束就可以实现。而且自己可以根据需求任意构造自己的SVM目标函数，然后用Lagrange 方法转换为对偶形式，然后当作一个有约束线性规划问题用Matlab来解。至于有约束线性

规划问题，这是个大概半个世纪前就解决的问题，学过OR的人都知道它的解决方法。网上也有很多的Open Source来解决这个问题，直接Call那些代码就可以了。虽然林智仁教授也提供Source Code，是C++风格的，可读性不是太好。