关于python:pandas-drop函数错误 (label not contained in axis)

Pandas - Drop function error (label not contained in axis)

本问题已经有最佳答案,请猛点这里访问。

我有一个csv文件,如下所示:

1
2
3
4
index,Avg,Min,Max
Build1,56.19,39.123,60.1039
Build2,57.11,40.102,60.2
Build3,55.1134,35.129404123,60.20121

基于我在这里的问题,我可以通过这个简短的脚本向这个csv添加一些相关信息:

1
2
3
4
5
6
7
8
9
import pandas as pd

df = pd.read_csv('newdata.csv')
print(df)

df_out = pd.concat([df.set_index('index'),df.set_index('index').agg(['max','min','mean'])]).rename(index={'max':'Max','min':'Min','mean':'Average'}).reset_index()

with open('newdata.csv', 'w') as f:
    df_out.to_csv(f,index=False)

这就产生了这个csv:

1
2
3
4
5
6
7
index,Avg,Min,Max
Build1,56.19,39.123,60.1039
Build2,57.11,40.102,60.2
Build3,55.1134,35.129404123,60.20121
Max,57.11,40.102,60.20121
Min,55.1134,35.129404123,60.1039
Average,56.1378,38.1181347077,60.16837

我现在想要它,这样我可以更新这个csv。例如,如果我运行一个新的构建(例如build4),我可以将其添加到中,然后重新执行max、min和average行。我的想法是,我因此删除标签为max、min、average的行,添加我的新行,重做统计。我相信我需要的代码非常简单(只适用于max,但也有代表min和average的行):

1
2
df = pd.read_csv('newdata.csv')
df = df.drop('Max')

但是,这始终会导致值错误:标签['max']不包含在轴中

我已经创建了崇高文本的csv文件,这是问题的一部分吗?我读过其他关于这个的文章,没有一篇能帮助我解决这个问题。

我不确定是否允许这样做,但这里有一个到我的csv的下载链接,以防文件本身出现问题。

我有两个可能的答案:

  • 如何解决此放置问题
  • 如何添加更多的构建和更新统计信息(一个不带drop的方法)

  • 必须指定轴参数。默认值为轴=0,即行、列、轴=1。

    所以这应该是你的代码。

    1
    df = df.drop('Max',axis=1)

    编辑:看看这段代码:

    1
    2
    df = pd.read_csv('newdata.csv')
    df = df.drop('Max')

    您使用的代码没有指定csv文件的第一列包含数据帧的索引。因此,熊猫会在飞行中创建一个索引。这个索引纯粹是数字索引。所以您的索引不包含"max"。

    尝试以下操作:

    1
    2
    df = pd.read_csv("newdata.csv",index_col=0)
    df = df.drop("Max",axis=0)

    这将强制熊猫使用csv文件中的第一列作为索引。这意味着代码现在可以工作了。


    要删除熊猫中的特定列,只需执行以下操作:

    1
    del df['Max']