关于python:根据“not in”条件从数据帧中删除行

dropping rows from dataframe based on a “not in” condition

当日期列的值在日期列表中时,我想从熊猫数据框中删除行。以下代码不起作用:

1
2
3
a=['2015-01-01' , '2015-02-01']

df=df[df.datecolumn not in a]

我得到以下错误:

ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().


您可以使用pandas.Dataframe.isin

pandas.Dateframe.isin将根据每个元素是否在列表a中返回布尔值。然后,用~将其转换为TrueFalse,反之亦然。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
import pandas as pd

a = ['2015-01-01' , '2015-02-01']

df = pd.DataFrame(data={'date':['2015-01-01' , '2015-02-01', '2015-03-01' , '2015-04-01', '2015-05-01' , '2015-06-01']})

print(df)
#         date
#0  2015-01-01
#1  2015-02-01
#2  2015-03-01
#3  2015-04-01
#4  2015-05-01
#5  2015-06-01

df = df[~df['date'].isin(a)]

print(df)
#         date
#2  2015-03-01
#3  2015-04-01
#4  2015-05-01
#5  2015-06-01


您可以使用Series.isin

1
df = df[~df.datecolumn.isin(a)]

虽然错误消息表明可以使用all()any(),但只有当您希望将结果减少为单个布尔值时,它们才有用。但是,这不是您现在要做的,它是根据外部列表测试序列中每个值的成员资格,并保持结果完整(即,布尔序列,然后将用于切片原始数据帧)。

你可以在《哥特人》里读到更多关于这方面的内容。