【1】引言
前序学习进程中,已经学习了构建SVM软边界拉格朗日方程,具体方程形式为:
L(w,b,ξ,α,μ)=12∣∣w∣∣2+C∑i=1nξi−∑i=1nαi[yi(w⋅xi+b)−1+ξi]−∑i=1nμiξiL(w,b,\xi,\alpha,\mu)=\frac{1}{2}||w||^2+C\sum_{i=1}^{n}\xi_{i}-\sum_{i=1}^{n}\alpha_{i}[y_{i}(w\cdot x_{i}+b)-1+\xi_{i}]-\sum_{i=1}^{n}\mu_{i}\xi_{i}L(w,b,ξ,α,μ)=21∣∣w∣∣2+Ci=1∑nξi−i=1∑nαi[yi(w⋅xi+b)−1+ξi]−i=1∑nμiξi
【2】乘子非负性讨论
SVM软边界拉格朗日方程的乘子αi≥0,μi≥0\alpha_{i}\geq0,\mu_{i}\geq0αi≥0,μi≥0,这样设置的目的是为了满足KKT条件。
标准的KKT条件构造出来的梯度平衡方程为:
∇f(x∗)+∑i=1mλi∇gi(x∗)+∑j=1pμj∇hj(x∗)=0\nabla f(x^*)+\sum_{i=1}^{m}\lambda_{i}\nabla g_{i}(x^*)+\sum_{j=1}^{p}\mu_{j}\nabla h_{j}(x^*)=0∇f(x∗)+i=1∑mλi∇gi(x∗)+j=1∑pμj∇hj(x∗)=0
其中要求乘子λi≥0\lambda_{i}\geq 0λi≥0,对应gi(x)≤0g_{i}(x)\leq 0gi(x)≤0。
在SVM软边界的定义中,因为距离函数[yi(w⋅xi+b)−1+ξi][y_{i}(w \cdot x_{i}+b)-1+\xi_{i}][yi(w⋅xi+b)−1+ξi]是正的,所以拉格朗日函数里面先用减法将距离函数转化为一个减数,此时为满足距离函数带来的约束是负数,就必须规定αi≥0\alpha_{i}\geq 0αi≥0。
此外由于ξi≥0\xi_{i}\geq 0ξi≥0本身也是一个非负数,所以按照同样的原则,构造拉格朗日方程时,在其前面先给一个负号,再给一个非负数的乘子。
这样,SVM软边界拉格朗日方程的乘子αi≥0,μi≥0\alpha_{i}\geq0,\mu_{i}\geq0αi≥0,μi≥0,就实现了满足KKT条件的目的。
【3】总结
对SVM软边界拉格朗日方程的乘子非负性进行了理解。