支持向量机(一):支持向量机的分类思想

栏目: 编程工具 · 发布时间: 5年前

张磊:从事AI医疗算法相关工作

个人微信公众号:机器学习算法那些事(微信ID:zl13751026985)

前言

支持向量机是一种经典的机器学习算法,在小样本数据集的情况下有非常广的应用,我觉得,不懂支持向量机不算是入门机器学习 支持向量机(一):支持向量机的分类思想 。本篇循序渐进的讲解了支持向量机的分类思想,希望对您有帮助。

目录

1.  函数间隔和几何间隔

2.  支持向量机的分类思想

3.  总结

1. 函数间隔和几何间隔

为了能够更好的阐述支持向量机的分类思想,需要理解函数间隔和几何间隔的定义。

1. 点到超平面的距离

假设超平面方程:

点 到平面的距离:

由上式可得: ,没有分类信息,而函数间隔和几何间隔不仅包含了距离信息,还包含了分类信息。

2. 函数间隔和几何间隔

对于给定的训练数据集T,正样本和负样本分别为+1和-1,我们对式(1.1)稍微进行了修改:

(1).  点到平面的距离不作规范化处理,得:

(2).  去掉绝对值符号,并乘以标记结果y0,得:

d2表达式就是 函数间隔 的定义,有两层含义:大小表示点P0到超平面的距离,正负表示点P0是否正确分类,若d<0,分类错误;反之,则分类正确。

因此 ,我们定义点到超平面的函数间隔为:

接着定义 训练数据集T的函数间隔是所有样本点(xi,yi)的函数间隔的最小值 ,即:

其中,

但是,若成比例的增加超平面参数w和b,超平面没有改变,但是函数间隔却成比例的增加了,这是不符合理论的,因此,需要对函数间隔进行规范化,得:

(1.7)式就是 几何间隔 的定义,几何间隔的值是确定的。

2.  支持向量机的分类思想

1.  感知机和logistic回归的分类思想

感知机的损失函数 为所有误分类点到超平面的距离之和:

无误分类点时,损失函数为0,满足模型分类条件的超平面有无数个,如下图:

初始超平面为l1,误分类点为红色框,最小化式(2.1)有无穷多个满足损失函数为0的超平面,如上图的l2~ln,然而, 最佳分类超平面只有一个,即支持向量机所对应的超平面。

假设logistic回归的模型是 , logistic回归的损失函数:

支持向量机(一):支持向量机的分类思想

简单分析(2.2)式的分类思想:

(1). 当yi=1时 ,损失函数简化为:

若要使损失函数 越小越好,则xi的值越大越好,如下图:

支持向量机(一):支持向量机的分类思想

图2.1

当 往箭头方向移动时,损失函数 逐渐变小。

(2).  当yi=0时,损失函数简化为:

若要使损失函数 越小越好,则xi的值越小越好,如下图:

支持向量机(一):支持向量机的分类思想

当 往箭头方向移动时,损失函数 逐渐变小。

2. 支持向量机的分类思想

支持向量机结合了感知机和logistic回归分类思想,假设训练样本点(xi,yi)到超平面H的几何间隔为γ(γ>0),由上节定义可知,几何间隔是点到超平面最短的距离,如下图的红色直线:

用logisitic回归模型分析几何间隔:

因此,当γ越大时,损失函数越小,结果为正样本的概率也越大。

因此, 感知机的分类思想是最大化点到超平面的几何间隔, 这个问题可以表示为下面的约束最优化问题:

支持向量机(一):支持向量机的分类思想

根据几何间隔和函数间隔的关系,得几何间隔的约束最优化问题:

支持向量机(一):支持向量机的分类思想

函数间隔是样本点到超平面的最短距离,因此,令函数间隔为常数1,那么其他样本点到超平面的距离都大于1,且最大化 和最小化 是等价的。 于是就得到下面的最优化问题:

支持向量机(一):支持向量机的分类思想

由(2.8)式和(2.9)式,解得最优解w*,b*,易知最优超平面到正负样本的几何间隔相等(请理解几何间隔的含义,然后仔细回想整个分类过程,就会得到这个结论)。

3. 总结

本文结合了感知机和logistic回归的分类思想来推导支持向量机的最优化问题,即最大间隔分离超平面。

参考

李航 《统计学习方法》

- END -

公众号后台回复关键词学习

回复  免费

  获取免费课程

回复  直播                 获取系列直播课

回复  Python             1小时破冰入门Python

回复  人工智能         从零入门人工智能

回复 深度学习           手把手教你用 Python 深度学习

回复  机器学习           小白学数据挖掘与机器学习

回复  贝叶斯算法       贝叶斯与新闻分类实战

数据分析师       数据分析师八大能力培养

回复 自然语言处理 自然语言处理之AI深度学习

支持向量机(一):支持向量机的分类思想

本文由Python爱好者社区 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。

转载、引用前需联系作者,并署名作者且注明文章出处。

本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。


以上所述就是小编给大家介绍的《支持向量机(一):支持向量机的分类思想》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

深入理解LINUX网络技术内幕

深入理解LINUX网络技术内幕

Christian Benvenuti / 夏安、闫江毓、黄景昌 / 中国电力出版社 / 2009-6 / 128.00元

Linux如此的流行正是得益于它的特性丰富及有效的网络协议栈。如果你曾经惊叹于Linux能够实现如此复杂的工作,或者你只是想通过现实中的例子学习现代网络,《深入理解Linux网络内幕》将会给你指导。同其他O'Reilly的流行书籍一样,《深入理解Linux网络内幕》清楚地阐述了网络的基本概念,并指导你如何用C语言实现。虽然早先的 TCP/IP经验是有用的,但初学者通过《深入理解Linux网络内幕》......一起来看看 《深入理解LINUX网络技术内幕》 这本书的介绍吧!

CSS 压缩/解压工具
CSS 压缩/解压工具

在线压缩/解压 CSS 代码

随机密码生成器
随机密码生成器

多种字符组合密码

XML、JSON 在线转换
XML、JSON 在线转换

在线XML、JSON转换工具