加载中
加载中
表情图片
评为精选
鼓励
加载中...
分享
加载中...
文件下载
加载中...
修改排序
加载中...
[机器学习笔记#3] 简明Lagrange multiplier(拉格朗日乘数)讲义
Cirno2016/08/06软件综合 IP:美国

[机器学习笔记#1]从 Logistic Regression 讲讲分类器和机器学习
[机器学习笔记#2] 一步步用 softmax Regression 实现手写字符识别
[资源分享]机器学习资料和常用工具汇总

(这次的笔记是为了以后的内容做准备,提前介绍一些基础数学知识,以便日后引用)

在机器学习中经常会遇到一类受限优化问题,要求某目标函数在限制条件下的最优值点。

最基本的一类问题可简述为:

问题1:给定目标函数 f(x)(假设convex),求当x取值满足g(x)=0的条件下,x的最优值使得f(x)的值最小/最大。

例如:
x=argmaxx  f(x) s.t.g(x)=0 由于这里我们预先假设f(x)是一个凸函数(convex function),当不存在限制条件时,其最大值当取在使得f(x)=0处。而存在限制条件时,表示x在定义域中的位置必须落在曲面g(x)=0上,可想象为x在该曲面表面滑动,直到找到使得f(x)最大的位置时停止。

我们可以非常自然的得到一个结论:满足此条件的位置xA上,必然有f(x)=λg(x),其中λ是非零实变量,被称为拉格朗日乘数(Lagrange multiplier)。如下图所示(图片出自PRML P. 708)。
Screenshot from 2016-08-05 19:03:03.png 因为如果在此处f(x)g(x)不共线,f(x)将在该点有一个切向分量,x可沿该分量方向运动,到达一个使 f(x) 更大的点(参考gradient ascend),最终会稳定在一个使得 f(x)g(x) 共线的位置。
Screenshot from 2016-08-05 19:03:03_2.png
所以可知求解问题1中的受限优化问题,等同于求解:
x,λ=argmaxx,λ  L(x,λ) L(x,λ)=f(x)+λg(x),  λ0 s.t.  xL(x,λ)=0,  λL(x,λ)=0
其中L(x,λ)被称为拉格朗日方程。

以下借用PRML中的一个例子,令: x=(x1,x2),  f(x)=1x12x22,  g(x)=x1+x21=0
即如下图示:
Screenshot from 2016-08-05 19:56:05.png 所以: L(x,λ)=1x12x22+λ(x1+x21) 求导得:
2x1+λ=0 2x2+λ=0 x1+x21=0 解得 x1=x2=0.5


问题2:给定目标函数 f(x)(假设convex),求当x取值满足g(x)0的条件下,x的最优值使得f(x)的值最小/最大。

例如:
x=argmaxx  f(x) s.t.g(x)0 问题1中的等式变成了不等式,x的可能取值空间从曲面 g(x)=0 ,变成了 g(x)0所表示的内部空间j及表面,如下图:
Screenshot from 2016-08-05 20:05:56.png
所以分两种情况考虑:

  1. x 取在 g(x)>0的腔体内,此时问题跟无限制条件时无区别,所以是求解f(x)=0,等同于将拉格朗日方程中的λ设为0的情况;
  2. x 取在 g(x)=0的曲面上,此时优化f(x)跟问题1无区别,使用拉格朗日方程求解。

整合起来就是求:
x,λ=argmaxx,λ  L(x,λ) L(x,λ)=f(x)+λg(x) 其中: g(x)0 λ0 λg(x)=0 上述条件被称为 Karush-Kuhn-Tucker 条件,简称 KKT 条件。注意这里是针对 maximization的情况,如果是 minimization, 则拉格朗日方程变为 L(x,λ)=f(x)λg(x) (原因自己想,提示:当最优解在曲线表面时,即情况2,f(x) 应该朝着哪个方向?)。

KKT条件在SVM 的数学模型中有重要体现。

[修改于 8年11个月前 - 2016/08/06 14:49:59]

来自:计算机科学 / 软件综合
0
新版本公告
~~空空如也

想参与大家的讨论?现在就 登录 或者 注册

所属专业
所属分类
上级专业
同级专业
Cirno
专家 进士 老干部 学者 机友 笔友
文章
34
回复
359
学术分
2
2012/09/03注册,2个月21天前活动

Machine Learning, computer vision enthusiast

Google

主体类型:个人
所属领域:无
认证方式:手机号
IP归属地:未同步
插入公式
评论控制
加载中...
文号:{{pid}}
投诉或举报
加载中...
{{tip}}
请选择违规类型:
{{reason.type}}

空空如也

笔记
{{note.content}}
{{n.user.username}}
{{fromNow(n.toc)}} {{n.status === noteStatus.disabled ? "已屏蔽" : ""}} {{n.status === noteStatus.unknown ? "正在审核" : ""}} {{n.status === noteStatus.deleted ? '已删除' : ''}}
  • 编辑
  • 删除
  • {{n.status === 'disabled' ? "解除屏蔽" : "屏蔽" }}
我也是有底线的