稀疏核机（下）：稀疏性

栏目: 编程工具 · 发布时间: 5年前

内容简介：第一时间获取好内容

点击上方“ 大数据与人工智能 ”，“星标或置顶公众号”

第一时间获取好内容

稀疏核机（下）：稀疏性

作者丨stephenDC

这是作者的第 8 篇文章

本文是“稀疏核机”这个专题的第三篇，也是最后一篇。

在《稀疏核机（上）—SVM回顾》中，我们简单回顾了SVM的导出；在《稀疏核机（中）—核方法》中，我们从SVM的基函数扩展，引出了核方法。至此，准备工作已经完成，我们在本篇重点讨论核机的稀疏性。

主要内容包括：

稀疏核机的正式概念
SVM作为一种典型的稀疏核机，其稀疏性从何而来？
SVM是最稀疏的核机吗？
是否有办法获得比SVM更稀疏的核机？

稀疏核机

稀疏核机（下）：稀疏性

SVM的稀疏性

我们可以从最大化Margin、Hinge损失函数、对偶问题的约束项，这3个不同的角度来理解SVM的稀疏性。

Part 1

最大化Margin

先来回顾一下，对二分类问题，Margin的意义如下图所示。表示两类样本距离分隔超平面最小距离的2倍。

稀疏核机（下）：稀疏性

对线性可分的二分类问题，有无数个超平面可以将两个类别分开，而SVM定义为最大化Margin所确定的超平面。那么，最大化Margin的意义是什么呢？

a. 使结构风险最小化：样本点距分隔超平面的距离，代表了一种分类的确信度，最大化Margin显然增加了最可能被误分类的样本的分类确信度。

b. 让分隔超平面唯一化：虽然有无数个超平面可以将两类样本分开，但同时要让Margin最大，这个超平面就唯一确定了

问题来了，这个唯一的分隔超平面跟哪些样本点有关呢？从直觉上我们很容易发现，最大化Margin的超平面至少跟离超平面很远的那些点是没有关系的。

这当然只是一种直觉式的不严谨的理解，我们下面用Hinge损失函数来说明，这种直觉是对的。

Part 2

Hinge损失函数

稀疏核机（下）：稀疏性

Part 3 对偶问题的约束项

稀疏核机（下）：稀疏性

例子：

稀疏核机（下）：稀疏性

a. 定义核机的模型

b. 给每个样本点定义一个参数，表示该样本跟最终预测模型的相关性

c. 在模型学习的过程中，将这些相关性参数跟其他模型参数一起学习出来

RVM模型

稀疏核机（下）：稀疏性

大型网站技术架构演进与性能优化

许令波 / 电子工业出版社 / 2018-6 / 79

《大型网站技术架构演进与性能优化》从一名亲历者的角度，阐述了一个网站在业务量飞速发展的过程中所遇到的技术转型等各种问题及解决思路。从技术发展上看，网站经历了Web应用系统从分布式、无线多端、中台到国际化的改造；在解决大流量问题的方向上，涉及了从端的优化到管道到服务端甚至到基础环境优化的各个层面。《大型网站技术架构演进与性能优化》总结的宝贵经验教训可以帮助读者了解当网站遇到类似问题时，应如何......一起来看看《大型网站技术架构演进与性能优化》这本书的介绍吧!

码农工具

稀疏核机（下）：稀疏性

稀疏核机的正式概念

SVM作为一种典型的稀疏核机，其稀疏性从何而来？

SVM是最稀疏的核机吗？

是否有办法获得比SVM更稀疏的核机？

最大化Margin

Hinge损失函数

Part 3

对偶问题的约束项

a. 定义核机的模型

b. 给每个样本点定义一个参数，表示该样本跟最终预测模型的相关性

c. 在模型学习的过程中，将这些相关性参数跟其他模型参数一起学习出来

大型网站技术架构演进与性能优化

在线进制转换器

XML、JSON 在线转换

RGB HSV 转换