KKT (LICQ)
H. E. Krogstad, TMA 4180 Optimeringsteori KARUSH-KUHN-TUCKER THEOREM
KKT条件在处理有约束问题的时候很有用, 但是对KKT的适用性一直不是很理解, 看了这篇讲解整理一下.
基本内容
问题
\min_{x \in \Omega} f(x),
\]
在等式约束条件:
c_i(x) = 0, i \in \xi,
\]
及不等约束条件:
c_i(x) \ge 0, i \in \mathcal{I}.
\]
不妨就记
\]
在不等式约束中, 即只有当我们所寻的极值点\(x^*\)处, \(c_i(x^*)=0, i \in \mathcal{I}\)称之为激活不等式约束(active inequality constraints), 否则为不激活的, 我们记激活的不等式约束和等式约束为\(\mathcal{A}\).
注: 均连续可微.
对于任意一个可行点\(x_0\), 令\(x(t), t\ge 0\)为一连续路径, 满足\(t\rightarrow 0, x(t) \rightarrow x_0\),定义\(d\)为:
\]
有如下性质:
\nabla c_i(x) d = 0, i \in \xi \\
\nabla c_i(x) d \ge 0, i \in \mathcal{I \cap A},
\]
其中, 我们假设梯度向量为行向量.
证明:
\]
两边同除以\(\|x(t)-x_0\|\), 并令\(t \rightarrow 0\)即可得.
\]
与上面同样的操作即可得.
我们把这些由路径引导出来的可行方向\(d\)的集合记为
\mathcal{T}(x) = \{d: d \: feasible \: di rection \: out \: from \: x\}.
\]
而记满足\((8, 9)\)的一切\(d\)的集合记为\(\mathcal{F}(x)\), 显然\(\mathcal{T}(x) \subset \mathcal{F}(x)\), 且均为锥(即\(d\)属于此集合, 则\(\alpha d, \alpha > 0\)也属于此集合).
LICQ 假设
点\(x_0\)满足LICQ假设, 当
\{\nabla c_i(x_0)\}, i \in \mathcal{A},
\]
是线性独立的.
线性不独立: 当集合中存在一个向量能够由其他向量线性表出, 否则称此集合线性独立. 显然这是比线性无关更强的一个概念.
KKT 定理
假设\(x^*\)是问题(1)在等式约束(2)以及不等式约束(3)的限制下的局部最小值点, 且满足LICQ假设. 则存在\(\lambda_i^*\)满足:
\nabla f(x^*) = \sum_{i \in \xi \cup \mathcal{I}} \lambda_i^* \nabla c_i(x^*),
\]
且
\begin{array}{lc}
(i) & \lambda_i^* \cdot c_i(x^*) = 0, i \in \xi \cup \mathcal{I}, \\
(ii) & \lambda_i^* \ge 0, i \in \mathcal{I}.
\end{array}
\]
KKT定理的证明
记:
\left [
\begin{array}{c}
\nabla c_1(x) \\
\vdots \\
\nabla c_m(x)
\end{array}
\right ]
\]
属于\(\mathcal{A}\)的所有\(c_i\)的梯度的综合表示,
\]
引理A
引理A: 当\(x \in \R^n\)满足LICQ假设, 则\(\mathcal{T}(x) = \mathcal{F}(x)\).
证明:
既然\(\mathcal{T}(x) \subset \mathcal{F}(x)\), 我们只需要证明\(\mathcal{F}(x) \subset \mathcal{T}(x)\).
下面, \(\forall d \in \mathcal{F}(x)\), 我们将构造\(y(t), t \ge 0\), 为一连续的起点为\(y(0)=x\)的路径, 且在\(x\)的足够小的一个邻域内\(y(t)\)满足等式约束和不等式约束, 一旦找到这样的\(y(t)\), 证明也就完成了.
根据假设可知, dim(\(A\)) = \(m\), 则\(A\)的核的维数为\(dim(N(A))=n-m\), 我们从核空间中抽取一组基作为行向量构建\(Z'\), 则
\left [
\begin{array}{c}
A \\
Z'
\end{array}
\right ]
\]
是一个非奇异的\(n\times n\)的方阵.
考虑如下的非线性方程系统(显然有解\(t=0,y=x\))
R(y, t) = \left [
\begin{array}{c}
c(y) - tAd \\
Z'(y - x -td)
\end{array}
\right ] = 0.
\]
关于\(y\)的加科比行列式为
\frac{\partial R}{\partial y} |_{t=0} =
\left [
\begin{array}{c}
A \\
Z'
\end{array}
\right ],
\]
非奇异, 所以根据隐函数定理可知, 在\(t\)足够小的时候, 存在连续可微函数\(y(t)\), 且\(y(0)=x\).
既然
c(y)=c(x) + \nabla c(x)(y-x) + o(\|y-x\|) = A(y-x)+o(\|y-x\|),
\]
我们有
0=R(y(t),t) =
\left [
\begin{array}{c}
A \\
Z'
\end{array}
\right ] (y(t)-x-td) + o(\|y(t)-x\|).
\]
也就是说
y(t)-x=td+o(\|y(t)-x\|),
\]
俩边令\(t \rightarrow 0\), 可知\(y(t)\)为\(d\)的一个连续路径.
又结合(25)
c(y(t))-tAd=0,
\]
c_i(y(t))=t\nabla c_i(x)d =
\left \{
\begin{array}{ll}
0, & i \in \xi \\
\ge 0 , & i \in \mathcal{I \cap A} .
\end{array}
\right .
\]
所以对于任意的\(i \in \mathcal{A}\), \(y(t)\)是可行路径, 对于未激活的不等式约束, 既然\(y(t)\)是连续的, 当\(t\)足够效地时候容易得到\(c_i(y(t)) > 0, i \in \mathcal{I}, i \not \in \mathcal{A}\). 这样便证明了, \(\forall d \in \mathcal{F}(x)\), 均为可行方向, 故\(\mathcal{F}(x) =\mathcal{T}(x)\).
Farkas 引理
Farkas 引理: 令\(g\)和\(\{a_i\}_{i=1}^m\)为\(n\)维行向量且
\mathcal{S} = \{ d \in \mathbb{R}^n; gd<0 , a_id \ge 0, i=1, \ldots, m\},
\]
则\(\mathcal{S} = \empty\)当且仅当存在非负向量\(\lambda \in \mathbb{R}^m\) 使得
g = \sum_{i=1}^m \lambda_i a_i.
\]
证明:
\(\Leftarrow\)
\(\forall d \in \mathcal{S}\),
\]
故\(\mathcal{S} = \empty\).
\(\Rightarrow\)
若不存在这样的\(\lambda\), 即对于任意的\(\lambda\), \(g \not =\sum_{i=1}^m \lambda_i a_i\), 则\(g\)不能由\(\{a_i\}\)线性表出. 不妨假设\(\{a_i\}\)与\(g\)按序进行施密特正交化过程, 可得\(\{\hat{a}_i\}\)为\(\{a_i\}\)的一正交向量组, \(h\)为
\]
则
\langle h, g \rangle = l \not = 0.
\]
不妨设\(l<0\)(否则\(h=-h\)), 则\(h \in \mathcal{S}\), 这与\(\mathcal{S} = \empty\)矛盾.
证毕.
定义问题\(\mathcal{P}\):
gd < 0, \\
Ad \ge 0.
\]
定义问题\(\mathcal{D}\):
g = \lambda^T A, \lambda \ge 0.
\]
推论
推论: 要么问题\(\mathcal{P}\)存在解, 要么\(\mathcal{D}\)存在解, 二者不能同时成立.
KKT定理的证明
既然\(x^*\)是一局部极值点, 则
\nabla f(x^*) d \ge 0, \forall d \in \mathcal{T} (x^*) =\mathcal{F}(x^*),
\]
将\(\nabla f(x^*)\)视作Farkas引理中的\(g\), \(A\)即为我们最开始定义的\(A\), 则\(\forall Ad \ge 0\), \(d \in \mathcal{F}(x)\), 这是因为所有等式约束\(c_i(x)=0\), 都可以变成俩个不等式约束\(c_i(x)\ge0, -c_i(x) \ge 0\). 这也就是说, 问题\(\mathcal{P}\)无解, 则\(\mathcal{D}\)有解, 即存在\(\lambda^* \ge 0\):
\nabla f(x^*) = \sum \lambda_i^* \nabla c_i(x^*), \lambda_i^* \ge 0.
\]
对于任意的\(i \not \in \mathcal{A}\), 我们只需取\(\lambda_i^*=0\), (39)依然成立, 同时原定理(18)中的(i)(ii)也同样容易证明.
最新文章
- 排序算法总结第二弹----冒泡排序---javascript描述
- Python之实用的IP地址处理模块IPy
- python pip安装问题
- The Bottom of a Graph-POJ2553强连通
- Nodejs学习总结 -Express入门(一)
- 关于Android的背景色配色小结
- Q114第一颗二叉查找树(链式)
- jquery二级目录选中当前页的样式
- 常用meta整理【转载】
- HW2.5
- C# ;对Outlook联系人的增、删、查 ;
- 提高Maven下载jar包的速度
- 2018-2019-2 网络对抗技术 20165321 Exp1 PC平台逆向破解
- myBase7.0破解
- JMeter——JMeter如何进行汉化
- 【非专业前端】Vue UI 之 建立Vuetify工程
- Android Launcher分析和修改8——AllAPP界面拖拽元素(PagedViewWithDraggableItems)
- css overflow和float
- NHibernate 数据查询之Linq to NHibernate
- MYSQL 5.7 sqlmode 行为
热门文章
- Scala【需求二:求各省市的各个指标】
- CentOS7 安装配置RocketMQ --主从模式(master-slave)异步复制
- 【Netty】最透彻的Netty原理架构解析
- winxp 关闭445端口
- SpringMVC(3):AJAX
- 索引以及Mysql中的索引
- ERROR: Command errored out with exit status 1:安装pip3 install --user pyecharts==0.5.11失败问题总结
- EmmyLua 注解功能
- Pytorch入门中 —— 搭建网络模型
- oracle中net manager的配置