python – 从pandas dataFrame中删除NaNs

栏目: Python · 发布时间: 7年前

内容简介:翻译自:https://stackoverflow.com/questions/17969878/drop-nans-from-a-pandas-dataframe

我不明白NaN是如何被大熊猫对待的,会很乐意得到一些解释,因为逻辑似乎对我“破坏”.

我有一个csv文件,我使用read csv加载.我在该文件中有一个“注释”列,大多数时候都是空的.

我已经隔离了该列,并尝试了不同的方法来删除空值.首先,当我写作:

marked_results.comments

我明白了:

0       VP
1       VP
2       VP
3     TEST
4      NaN
5      NaN
....

该列的其余部分是NaN.

所以pandas将空条目加载为NaN.到目前为止很棒.

现在我试图删除这些条目.我尝试过:

marked_results.comments.dropna()

并收到相同的专栏.没有什么被丢弃.困惑,我试图理解为什么没有丢弃,所以我尝试:

marked_results.comments==NaN

并收到了一系列法利斯.没有什么是NaNs ……令人困惑.

然后我试过:

marked_results.comments==nan

而且,除了愚蠢之外别无他物.我在那里有点生气,并且认为更聪明.所以我做了:

In [71]:
comments_values = marked_results.comments.unique()
comments_values 
Out[71]:
array(['VP', 'TEST', nan], dtype=object)

啊,得到了!所以我现在尝试过:

marked_results.comments==comments_values[2]

令人惊讶的是,仍然所有的结果都是法利斯!

唯一有效的是:

marked_results.comments.isnull()

它回归了预期的结果.谁能解释一下这里发生了什么?

你应该使用isnull和notnull来测试NaN(这些使用pandas dtypes比numpy更强大),见 “values considered missing” in the docs .

在列上使用Series方法 dropna 不会影响原始数据框,但可以执行您想要的操作:

In [11]: df
Out[11]:
  comments
0       VP
1       VP
2       VP
3     TEST
4      NaN
5      NaN

In [12]: df.comments.dropna()
Out[12]:
0      VP
1      VP
2      VP
3    TEST
Name: comments, dtype: object

dropna DataFrame方法有一个子集参数(用于删除在特定列中具有NaN的行):

In [13]: df.dropna(subset=['comments'])
Out[13]:
  comments
0       VP
1       VP
2       VP
3     TEST

In [14]: df = df.dropna(subset=['comments'])

翻译自:https://stackoverflow.com/questions/17969878/drop-nans-from-a-pandas-dataframe


以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

刷屏

刷屏

[美] 凯文•阿洛卡 / 侯奕茜、何语涵 / 中信出版社 / 2018-10-1 / 68.00

1. YouTube流行趋势经理,解密如何打造爆款视频 在视频时代,制造互动,才能创造潮流 用户不再是被动的观众,而是主动的传播者 2. 《刷屏》以行内人视角解读: 病毒视频 粉丝经济 网红产业 平台如何为内容创作者赋能 3. 你是否常常被病毒视频刷屏?你是否觉得很多网红火爆到“无法用常理解释”? 视频时代已经到来,我们每天观看网络......一起来看看 《刷屏》 这本书的介绍吧!

JS 压缩/解压工具
JS 压缩/解压工具

在线压缩/解压 JS 代码

html转js在线工具
html转js在线工具

html转js在线工具

HEX CMYK 转换工具
HEX CMYK 转换工具

HEX CMYK 互转工具