K-means真的不能使用曼哈顿距离吗?

栏目: IT技术 · 发布时间: 5年前

内容简介:说到k-means聚类算法,想必大家已经对它很熟悉了,它是基于距离计算的经典无监督算法,但是有一次在我接受面试时,面试官问了我一个问题:“k-means为什么不能使用曼哈顿距离计算,而使用欧式距离进行计算?”,当时我顿时懵了,心想:‘难道不都可以吗?’,我只能说都可以,然后面试官给了我一个眼神,“你回去查查吧,看看到底为什么”,然后我就回家啦。这是我后来在网上找到的回答,如下图:1.在样本数据中随机设置n个聚类中心(X

问题

说到k-means聚类算法,想必大家已经对它很熟悉了,它是基于距离计算的经典无监督算法,但是有一次在我接受面试时,面试官问了我一个问题:“k-means为什么不能使用曼哈顿距离计算,而使用欧式距离进行计算?”,当时我顿时懵了,心想:‘难道不都可以吗?’,我只能说都可以,然后面试官给了我一个眼神,“你回去查查吧,看看到底为什么”,然后我就回家啦。这是我后来在网上找到的回答,如下图:

K-means真的不能使用曼哈顿距离吗?

k-means基本思想:

1.在样本数据中随机设置n个聚类中心(X i ,Y i ),假设数据只有二维;

2.计算样本数据距离聚类中心(X i ,Y i )距离D i ,并各自归属到距离自己最近的中心点;

3.各个汇聚到一起的簇计算各自的平均值,将新的平均值作为新的中心点;

4.然后重复2、3两步,直到中心点的移动范围小于阈值或达到循环最大次数。

距离公式

K-means真的不能使用曼哈顿距离吗?

欧式距离也叫欧几里得距离,也是最广泛使用的距离计算公式,指n维空间中两点间的直线距离

K-means真的不能使用曼哈顿距离吗?

曼哈顿距离指同一坐标系下两点差的绝对值之和

K-means真的不能使用曼哈顿距离吗?

多说一个,余弦距离指空间中原点与两点连线所夹角度的大小

分析

那到底k-means、knn能不能用曼哈顿计算呢,如第一张图片所示,这是别人的答案,表示曼哈顿具有维度限制,真的是这样吗,我认为并不是这样的,大家都知道曼哈顿距离可以计算二维空间两点距离,那么尝试在三维空间进行计算,由此可以推广到高维空间,如下手画图所示:

一个2x2x2的立方体,坐落在三维坐标轴上,点A(2,2,0),点C(0,0,2),求AC的曼哈顿距离,根据曼哈顿公式计算得:

|0-2|+|0-2|+|2-0|=6,显而易见,实际距离也是6,路线有很多条,但结果都是一样的。

K-means真的不能使用曼哈顿距离吗?

结论

综上所述,曼哈顿距离适合k-means,只是各种距离算法可能需要在不同业务场景或数据下选择使用。


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Learning JavaScript

Learning JavaScript

Shelley Powers / Oreilly & Associates Inc / 2006-10-17 / $29.99

As web browsers have become more capable and standards compliant, JavaScript has grown in prominence. JavaScript lets designers add sparkle and life to web pages, while more complex JavaScript has led......一起来看看 《Learning JavaScript》 这本书的介绍吧!

CSS 压缩/解压工具
CSS 压缩/解压工具

在线压缩/解压 CSS 代码

HTML 编码/解码
HTML 编码/解码

HTML 编码/解码

MD5 加密
MD5 加密

MD5 加密工具