支持向量机分类器.docx
- 文档编号:25952161
- 上传时间:2023-06-16
- 格式:DOCX
- 页数:2
- 大小:17.37KB
支持向量机分类器.docx
《支持向量机分类器.docx》由会员分享,可在线阅读,更多相关《支持向量机分类器.docx(2页珍藏版)》请在冰豆网上搜索。
支持向量机分类器
支持向量机分类器
1支持向量机的提出与发展
支持向量机(SVM,supportvectormachine)是数据挖掘中的一项新技术,是借助于最优化方法来解决机器学习问题的新工具,最初由V.Vapnik等人在1995年首先提出,近几年来在其理论研究和算法实现等方面都取得了很大的进展,开始成为克服“维数灾难”和过学习等困难的强有力的手段,它的理论基础和实现途径的基本框架都已形成。
根据Vapnik&Chervonenkis的统计学习理论,如果数据服从某个(固定但未知的)分布,要使机器的实际输出与理想输出之间的偏差尽可能小,则机器应当遵循结构风险最小化(SRM,structuralriskminimization)原则,而不是经验风险最小化原则,通俗地说就是应当使错误概率的上界最小化。
SVM正是这一理论的具体实现。
与传统的人工神经网络相比,它不仅结构简单,而且泛化(generalization)能力明显提高。
2问题描述
2.1问题引入
假设有分布在Rd空间中的数据,我们希望能够在该空间上找出一个超平面(Hyper-pan),将这一数据分成两类。
属于这一类的数据均在超平面的同侧,而属于另一类的数据均在超平面的另一侧。
如下图。
比较上图,我们可以发现左图所找出的超平面(虚线),其两平行且与两类数据相切的超平面(实线)之间的距离较近,而右图则具有较大的间隔。
而由于我们希望可以找出将两类数据分得较开的超平面,因此右图所找出的是比较好的超平面。
可以将问题简述如下:
设训练的样本输入为xi,i=1,…,l,对应的期望输出为yi∈{+1,-1},其中+1和-1分别代表两类的类别标识,假定分类面方程为ω﹒x+b=0。
为使分类面对所有样本正确分类并且具备分类间隔,就要求它满足以下约束条件:
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 支持 向量 分类