内容简介:用官方的话来说,所谓K近邻算法,即是给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例(也就是上面所说的K个邻居), 这K个实例的多数属于某个类,就把该输入实例分类到这个类中。如果你之前没有学习过K最近邻算法,那今天几张图,让你明白什么是K最近邻算法。
用官方的话来说,所谓K近邻算法,即是给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例(也就是上面所说的K个邻居), 这K个实例的多数属于某个类,就把该输入实例分类到这个类中。
如果你之前没有学习过K最近邻算法,那今天几张图,让你明白什么是K最近邻算法。
图说开始
先来一张图,请分辨它是什么水果
很多同学不假思索,直接回答:“菠萝”!!!
仔细看看同学们,这是菠萝么?那再看下边这这张图。
这两个水果又是什么呢?
这就是菠萝与凤梨的故事,下边即将用菠萝和凤梨,给大家讲述怎么用一个算法来知道这是个什么水果的过程,也就是什么是K最近邻算法。
(给非吃货同学们补充一个生活小常识,菠萝的叶子有刺,凤梨没有。菠萝的凹槽处是黄色的,而凤梨的凹槽处是绿色的,以后千万不要买错哦!!!)
上边这张图中,我们定义了两个维度的特征:
-
一个是叶子是否有刺
-
一个是凹槽处是否的颜色
问:一个新的水果来了,我们怎么判断他是什么水果呢?
方法如下:
(看这个神秘水果与哪个水果的举例近。同等举例,看离它最近的水果中,哪个水果多)
根据上图中,我们判断,这个神秘水果那就是菠萝啦,原因是离它近的水果中菠萝比凤梨多。
相信到这里,大家都已经明白了什么是K最近邻算法了吧!
下边来具体学习一下距离的计算
假设我们有3中不知名的水果
我们现在根据其大小和颜色的特征,把它们放入图表中
那如我们如何判断他们有多像呢?
具体的计算,可以使用毕达哥拉斯公式
那现在来计算水果A和水果B之间的距离
最后的计算结果为1
那么同理,如果要让你去做一个推荐系统,我们可以把人的用户画像放在一个表格里
如果我们给其中一个人推荐他可能感兴趣的书、电影、美食等,就可以看一下离他最近距离的这些人都在做什么,然后就套用下边的公式就可以了
无论多少维度,直接套用就可以了。
图说算法,是不是非常的简单就理解了KNN。
祝大家学习愉快,欢迎转发。
以上所述就是小编给大家介绍的《图说十大数据挖掘算法(一)K最近邻算法》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!
猜你喜欢:- 数据挖掘领域十大经典算法之―朴素贝叶斯算法(附代码)
- python 数据挖掘算法简要
- 数据挖掘竞赛指南:曾经的数据挖掘少年,如今的阿里算法大佬
- 数据分析师、大数据开发、Hadoop开发工程师、数据挖掘、算法工程师各路人才薪资怎么样?
- 数据挖掘复习笔记---02.数据
- 数据挖掘建模:如何从数据中“淘金”?
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Java并发编程的艺术
方腾飞、魏鹏、程晓明 / 机械工业出版社 / 2015-7-1 / 59.00元
并发编程领域的扛鼎之作,作者是阿里和1号店的资深Java技术专家,对并发编程有非常深入的研究,《Java并发编程的艺术》是他们多年一线开发经验的结晶。本书的部分内容在出版早期发表在Java并发编程网和InfoQ等技术社区,得到了非常高的评价。它选取了Java并发编程中最核心的技术进行讲解,从JDK源码、JVM、CPU等多角度全面剖析和讲解了Java并发编程的框架、工具、原理和方法,对Java并发编......一起来看看 《Java并发编程的艺术》 这本书的介绍吧!