dropping rows from dataframe based on a “not in” condition
当日期列的值在日期列表中时,我想从熊猫数据框中删除行。以下代码不起作用:
1 2 3 | a=['2015-01-01' , '2015-02-01'] df=df[df.datecolumn not in a] |
我得到以下错误:
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
您可以使用
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 | import pandas as pd a = ['2015-01-01' , '2015-02-01'] df = pd.DataFrame(data={'date':['2015-01-01' , '2015-02-01', '2015-03-01' , '2015-04-01', '2015-05-01' , '2015-06-01']}) print(df) # date #0 2015-01-01 #1 2015-02-01 #2 2015-03-01 #3 2015-04-01 #4 2015-05-01 #5 2015-06-01 df = df[~df['date'].isin(a)] print(df) # date #2 2015-03-01 #3 2015-04-01 #4 2015-05-01 #5 2015-06-01 |
您可以使用
1 | df = df[~df.datecolumn.isin(a)] |
虽然错误消息表明可以使用
你可以在《哥特人》里读到更多关于这方面的内容。