内容简介:翻译自:https://stackoverflow.com/questions/17969878/drop-nans-from-a-pandas-dataframe
我不明白NaN是如何被大熊猫对待的,会很乐意得到一些解释,因为逻辑似乎对我“破坏”.
我有一个csv文件,我使用read csv加载.我在该文件中有一个“注释”列,大多数时候都是空的.
我已经隔离了该列,并尝试了不同的方法来删除空值.首先,当我写作:
marked_results.comments
我明白了:
0 VP 1 VP 2 VP 3 TEST 4 NaN 5 NaN ....
该列的其余部分是NaN.
所以pandas将空条目加载为NaN.到目前为止很棒.
现在我试图删除这些条目.我尝试过:
marked_results.comments.dropna()
并收到相同的专栏.没有什么被丢弃.困惑,我试图理解为什么没有丢弃,所以我尝试:
marked_results.comments==NaN
并收到了一系列法利斯.没有什么是NaNs ……令人困惑.
然后我试过:
marked_results.comments==nan
而且,除了愚蠢之外别无他物.我在那里有点生气,并且认为更聪明.所以我做了:
In [71]: comments_values = marked_results.comments.unique() comments_values Out[71]: array(['VP', 'TEST', nan], dtype=object)
啊,得到了!所以我现在尝试过:
marked_results.comments==comments_values[2]
令人惊讶的是,仍然所有的结果都是法利斯!
唯一有效的是:
marked_results.comments.isnull()
它回归了预期的结果.谁能解释一下这里发生了什么?
在列上使用Series方法
dropna
不会影响原始数据框,但可以执行您想要的操作:
In [11]: df Out[11]: comments 0 VP 1 VP 2 VP 3 TEST 4 NaN 5 NaN In [12]: df.comments.dropna() Out[12]: 0 VP 1 VP 2 VP 3 TEST Name: comments, dtype: object
dropna
DataFrame方法有一个子集参数(用于删除在特定列中具有NaN的行):
In [13]: df.dropna(subset=['comments']) Out[13]: comments 0 VP 1 VP 2 VP 3 TEST In [14]: df = df.dropna(subset=['comments'])
翻译自:https://stackoverflow.com/questions/17969878/drop-nans-from-a-pandas-dataframe
以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,也希望大家多多支持 码农网
猜你喜欢:- MySQL删除操作其实是假删除
- C++拾趣——STL容器的插入、删除、遍历和查找操作性能对比(Windows VirtualStudio)——删除
- 我用 Python 找出了删除我微信的所有人并将他们自动化删除了
- C++拾趣——STL容器的插入、删除、遍历和查找操作性能对比(Windows VirtualStudio)——遍历和删除
- ruby-on-rails-4 – Rails 4:如何从数据库中删除或删除(连接)表表?
- 删除并恢复
本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们。
Think Python
Allen B. Downey / O'Reilly Media / 2012-8-23 / GBP 29.99
Think Python is an introduction to Python programming for students with no programming experience. It starts with the most basic concepts of programming, and is carefully designed to define all terms ......一起来看看 《Think Python》 这本书的介绍吧!