Python, Memory Error in making dataframe
当我使用pandas DataFrame时,发生内存错误。
数据行为200000,列为30.(类型:列表)
fieldnames1有列名。(类型:列表)
发生错误:
1 | df = pd.DataFrame(data,columns=[fieldnames1]) |
我该怎么办?
(python版本2.7 32bit)
正如Klaus所说,你的内存已经不足了。 当您尝试一次性将整个文本拉到内存时,会发生此问题。
正如Wes McKinney在这篇文章中指出的那样,"解决方案是以较小的部分读取文件(使用
你可以试试这行代码:
1 | data=pd.DataFrame.from_csv("train.csv") |
这是read.csv的替代,但它返回Data框架对象而不会给出任何内存错误
P.S训练数据的大小约为73 mb