Python Pandas:如何只读取前n行的CSV文件?

Python Pandas: How to read only first n rows of CSV files in?

我有一个非常大的数据集,我无法读取整个数据集。所以,我想只读一部分进行训练,但我不知道该怎么做。 任何想法将不胜感激。


如果您只想读取前999,999(非标题)行:

1
read_csv(..., nrows=999999)

如果您只想读取1,000,000 ... 1,999,999行

1
read_csv(..., skiprows=1000000, nrows=999999)

nrows:int,default无要读取的文件行数。 对...有用
阅读大件文件*

skiprows:list-like或integer
要在文件开头跳过(0索引)或要跳过的行数(int)的行号

对于大文件,您可能还想使用chunksize:

chunksize:int,默认无
返回TextFileReader对象以进行迭代

pandas.io.parsers.read_csv文档