热力图的画法-分析数据

栏目: 数据库 · 发布时间: 6年前

内容简介:数据可视化往往可以帮助我们分析特征构成,寻找特征区间,以及解释实验结果的功能。热力图是常用的数据可视化方法之一。我们函数输入一个dataframe,然后吧图片写入到制定路径就可以了。一般直接打出来显示的不太清晰,还是保存起来比较好。值得注意的是,corr()函数原本计算出来的相关矩阵取值范围是(-1,1),-1代表最负相关,1代表最正相关,0代表不想关。我认为在机器学习领域,负相关在某种意义上与正相关是一致的。所以不相关才是我们意想中的无意义。所以我给他加上了abs取绝对值

数据可视化往往可以帮助我们分析特征构成,寻找特征区间,以及解释实验结果的功能。热力图是常用的数据可视化方法之一。

代码

def plot_heatmap(df, imagSavePath):
    """
    :param df: dataframe, which has column names
    :param imagSavePath: save the image to this path
    :return: no return, save files
    """
    matrix = abs(df.corr())
    plt.subplots(figsize=(50, 50))  # 设置画面大小
    sns.heatmap(matrix)
    plt.savefig(imagSavePath)
复制代码

我们函数输入一个dataframe,然后吧图片写入到制定路径就可以了。一般直接打出来显示的不太清晰,还是保存起来比较好。

值得注意的是,corr()函数原本计算出来的相关矩阵取值范围是(-1,1),-1代表最负相关,1代表最正相关,0代表不想关。我认为在机器学习领域,负相关在某种意义上与正相关是一致的。所以不相关才是我们意想中的无意义。所以我给他加上了abs取绝对值


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

C语言名题精选百则技巧篇

C语言名题精选百则技巧篇

冼镜光 / 机械工业出版社 / 2005-7 / 44.00元

《C语言名题精选百则》(技巧篇)收集了100则C语言程序设计题,共分9类。第一类比较简单,主要希望读者了解到《C语言名题精选百则》(技巧篇)的题目、解法与其他书籍之间的差异;第二至六类分别是关于数字、组合数学或离散数学、查找、排序、字符串等方面的题目;第七类列出了一些不太容易归类的题目,如Buffon丢针问题、Dijkstra的三色旗问题等;第八类则收录了一些有趣的、娱乐性的题目,如魔方阵等;第九......一起来看看 《C语言名题精选百则技巧篇》 这本书的介绍吧!

SHA 加密
SHA 加密

SHA 加密工具

XML、JSON 在线转换
XML、JSON 在线转换

在线XML、JSON转换工具

Markdown 在线编辑器
Markdown 在线编辑器

Markdown 在线编辑器