Pandas - Drop function error (label not contained in axis)
本问题已经有最佳答案,请猛点这里访问。
我有一个csv文件,如下所示:
1 2 3 4 | index,Avg,Min,Max Build1,56.19,39.123,60.1039 Build2,57.11,40.102,60.2 Build3,55.1134,35.129404123,60.20121 |
基于我在这里的问题,我可以通过这个简短的脚本向这个csv添加一些相关信息:
1 2 3 4 5 6 7 8 9 | import pandas as pd df = pd.read_csv('newdata.csv') print(df) df_out = pd.concat([df.set_index('index'),df.set_index('index').agg(['max','min','mean'])]).rename(index={'max':'Max','min':'Min','mean':'Average'}).reset_index() with open('newdata.csv', 'w') as f: df_out.to_csv(f,index=False) |
这就产生了这个csv:
1 2 3 4 5 6 7 | index,Avg,Min,Max Build1,56.19,39.123,60.1039 Build2,57.11,40.102,60.2 Build3,55.1134,35.129404123,60.20121 Max,57.11,40.102,60.20121 Min,55.1134,35.129404123,60.1039 Average,56.1378,38.1181347077,60.16837 |
我现在想要它,这样我可以更新这个csv。例如,如果我运行一个新的构建(例如build4),我可以将其添加到中,然后重新执行max、min和average行。我的想法是,我因此删除标签为max、min、average的行,添加我的新行,重做统计。我相信我需要的代码非常简单(只适用于max,但也有代表min和average的行):
1 2 | df = pd.read_csv('newdata.csv') df = df.drop('Max') |
但是,这始终会导致值错误:标签['max']不包含在轴中
我已经创建了崇高文本的csv文件,这是问题的一部分吗?我读过其他关于这个的文章,没有一篇能帮助我解决这个问题。
我不确定是否允许这样做,但这里有一个到我的csv的下载链接,以防文件本身出现问题。
我有两个可能的答案:
必须指定轴参数。默认值为轴=0,即行、列、轴=1。
所以这应该是你的代码。
1 | df = df.drop('Max',axis=1) |
编辑:看看这段代码:
1
2 df = pd.read_csv('newdata.csv')
df = df.drop('Max')
您使用的代码没有指定csv文件的第一列包含数据帧的索引。因此,熊猫会在飞行中创建一个索引。这个索引纯粹是数字索引。所以您的索引不包含"max"。
尝试以下操作:
1 2 | df = pd.read_csv("newdata.csv",index_col=0) df = df.drop("Max",axis=0) |
这将强制熊猫使用csv文件中的第一列作为索引。这意味着代码现在可以工作了。
要删除熊猫中的特定列,只需执行以下操作:
1 | del df['Max'] |