内容简介:翻译自:https://stackoverflow.com/questions/17969878/drop-nans-from-a-pandas-dataframe
我不明白NaN是如何被大熊猫对待的,会很乐意得到一些解释,因为逻辑似乎对我“破坏”.
我有一个csv文件,我使用read csv加载.我在该文件中有一个“注释”列,大多数时候都是空的.
我已经隔离了该列,并尝试了不同的方法来删除空值.首先,当我写作:
marked_results.comments
我明白了:
0 VP 1 VP 2 VP 3 TEST 4 NaN 5 NaN ....
该列的其余部分是NaN.
所以pandas将空条目加载为NaN.到目前为止很棒.
现在我试图删除这些条目.我尝试过:
marked_results.comments.dropna()
并收到相同的专栏.没有什么被丢弃.困惑,我试图理解为什么没有丢弃,所以我尝试:
marked_results.comments==NaN
并收到了一系列法利斯.没有什么是NaNs ……令人困惑.
然后我试过:
marked_results.comments==nan
而且,除了愚蠢之外别无他物.我在那里有点生气,并且认为更聪明.所以我做了:
In [71]: comments_values = marked_results.comments.unique() comments_values Out[71]: array(['VP', 'TEST', nan], dtype=object)
啊,得到了!所以我现在尝试过:
marked_results.comments==comments_values[2]
令人惊讶的是,仍然所有的结果都是法利斯!
唯一有效的是:
marked_results.comments.isnull()
它回归了预期的结果.谁能解释一下这里发生了什么?
在列上使用Series方法
dropna
不会影响原始数据框,但可以执行您想要的操作:
In [11]: df Out[11]: comments 0 VP 1 VP 2 VP 3 TEST 4 NaN 5 NaN In [12]: df.comments.dropna() Out[12]: 0 VP 1 VP 2 VP 3 TEST Name: comments, dtype: object
dropna
DataFrame方法有一个子集参数(用于删除在特定列中具有NaN的行):
In [13]: df.dropna(subset=['comments']) Out[13]: comments 0 VP 1 VP 2 VP 3 TEST In [14]: df = df.dropna(subset=['comments'])
翻译自:https://stackoverflow.com/questions/17969878/drop-nans-from-a-pandas-dataframe
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- MySQL删除操作其实是假删除
- C++拾趣——STL容器的插入、删除、遍历和查找操作性能对比(Windows VirtualStudio)——删除
- 我用 Python 找出了删除我微信的所有人并将他们自动化删除了
- C++拾趣——STL容器的插入、删除、遍历和查找操作性能对比(Windows VirtualStudio)——遍历和删除
- ruby-on-rails-4 – Rails 4:如何从数据库中删除或删除(连接)表表?
- 删除并恢复
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
笨办法学Python 3
[美]泽德 A. 肖 / 王巍巍 / 人民邮电出版社 / 2018-6-1 / CNY 59.00
本书是一本Python入门书,适合对计算机了解不多,没有学过编程,但对编程感兴趣的读者学习使用。这本书以习题的方式引导读者一步一步学习编程,从简单的打印一直讲到完整项目的实现,让初学者从基础的编程技术入手,最终体验到软件开发的基本过程。本书是基于Python 3.6版本编写的。 本书结构非常简单,除“准备工作”之外,还包括52个习题,其中26个覆盖了输入/输出、变量和函数3个主题,另外26个......一起来看看 《笨办法学Python 3》 这本书的介绍吧!