凸优化问题(OPT,convex optimization problem)指定义在凸集中的凸函数最优化的问题。尽管凸优化的条件比较苛刻,但仍然在机器学习领域有十分广泛的应用。
是凸集,如果对于任意的
和任意的
满足
时,
恒成立
直观来说,任取一个集合中的两点练成一条线段,如果这条线段完全落在该集合中,那么这个集合就是凸集。

凸集的几何意义
定义在
上的函数
是凸函数,如果它的定义域
是一个凸集且对任意的
和
,
恒成立

凸函数几何意义
假设定义在
上的函数
可微(即对于所有
,梯度
均存在)。则函数
是凸函数当且仅当函数定义域
是一个凸集,且对于所有
均满足:
一阶充要条件从几何意义上讲,即定义域内所有函数值都大于等于该点的一阶近似。

凸函数一阶充要条件的几何意义
记函数的一阶导数和二阶导数分别为
和
:
假设定义在
上的函数
二阶可微(即对于所有
,海森矩阵
均存在)。则函数
是凸函数当且仅当函数定义域
是一个凸集,且对于所有
均满足:
注意:这里的
表示的是半正定。
正定矩阵的概念是从正定二次型引入的,对称矩阵
为正定的充要条件即该矩阵的特征值全为正数。
为方便理解正定/半正定矩阵,我们引入二次型
,对于含有
个变量的二次齐次函数,我们可以一般化地写为:
同时,对于所有的二次齐次式我们都可以写成矩阵形式:
如果对任意的
均有
,则称
为正定二次型,同时称
为正定矩阵。
因为对于任意的二次型,我们都能将其写为矩阵形式,且矩阵
的形式为:
因此二次型矩阵和对称矩阵是一一对应的关系。
对于最简单的一元二次函数
,当
时
恒成立。即一元正定二次型对应的图像是开口向上,顶点在原点的抛物线,同理二元正定二次型
对应的图像是开口向上,顶点在原点的抛物面。

二元正定二次型图像
扩展到
元正定二次型的图像也对应着一个抛物线,保证当自变量取值非零向量时,对应的函数值大于0恒成立。
同样我们可以给出二元半正定二次型的图像,即某个自变量的特征值为0从而保证当自变量取值为非零向量时,对应的函数值大于等于0恒成立。

二元半正定二次型图像
当
和
均为凸函数,而
均为仿射函数时, 上述的优化问题即凸优化问题。
其中目标函数和不等式约束都是仿射函数,且
表示按元素小于等于。
其中目标函数为凸二次型,不等式约束为仿射函数。
其中目标函数和不等式约束都是凸二次型。
其中需要最优化的变量
是一个对称的半正定矩阵,且
为对阵矩阵。
由于凸优化问题具有局部最优解即全局最优解的优良特性,因此求解过程可以简化为:找到一个点列使得目标函数值持续减少,直到触发停止条件或达到一个最小值。
设
为第
次迭代的值,
为第
次搜索方向,
为第
次迭代的步长,则第
次迭代公式为:
其中第
次的搜索方向满足:
[1] https://www.jiqizhixin.com/articles/2019-03-05-8 [2] https://www.zhihu.com/question/38902714/answer/195435181 [3] https://www.jianshu.com/p/62539b0316e2 [4] plot: matplotlib.pyplot [5] http://cs229.stanford.edu/section/cs229-cvxopt.pdf