关于python:在谷歌colab中读取csv到dataframe

read csv to dataframe in google colab

我正在尝试读取存储在本地计算机上的csv文件。(仅供参考,这里是Kaggle的泰坦尼克号数据。)

从这个问题和答案中,我了解到您可以使用这个代码导入数据,这对我来说很好。

1
2
from google.colab import files
uploaded = files.upload()

我迷失的地方是如何将它从这里转换为数据帧。上面答案中列出的谷歌笔记本的示例页面并没有提到它。

我正在尝试使用from_dict命令将字典uploaded转换为数据帧,但无法使其正常工作。这里有一些关于将dict转换为dataframe的讨论,但这些解决方案不适用于我(我认为)。

综上所述,我的问题是:

1
2
How do I convert a csv file stored locally on my files to pandas
datframe on google-colaboratory?


大熊猫read_csv应该做到这一点。因为read_csv需要一个类似文件的对象,所以您需要将上传的字节包装在io.StringIO中。

下面是一个完整的例子:https://colab.research.google.com/notebook fileid=1jmwtf5omsghc-y3-bkvxlan0zyxqcjjf

关键代码段是:

1
2
3
4
5
import pandas as pd
import io

df = pd.read_csv(io.StringIO(uploaded['train.csv'].decode('utf-8')))
df


步骤1-将您的Google驱动器安装到合作伙伴

1
2
from google.colab import drive
drive.mount('/content/gdrive')

第2步-现在您将在左窗格(文件资源管理器)中看到您的谷歌驱动器文件。右键单击需要导入的文件并选择?opy路径。然后像往常一样导入熊猫,使用这个复制的路径。

1
2
import pandas as pd
df=pd.read_csv('gdrive/My Drive/data.csv')

完成!


这对我很有用:

1
2
3
4
5
6
7
8
9
10
11
12
from google.colab import auth
auth.authenticate_user()

from pydrive.drive import GoogleDrive
from pydrive.auth import GoogleAuth
from oauth2client.client import GoogleCredentials
gauth = GoogleAuth()
gauth.credentials = GoogleCredentials.get_application_default()
drive = GoogleDrive(gauth)

myfile = drive.CreateFile({'id': '!!!YOUR FILE ID!!!'})
myfile.GetContentFile('file.csv')

!!!YOUR FILE ID!!!替换为Google Drive中文件的ID(这是单击"获取链接以共享"时出现的长字母数字字符串)。然后,您可以使用pandas的read_csv访问file.csv:

1
2
import pandas as pd
frm = pd.read_csv('file.csv', header=None)


colab google:从你的电脑上传csv我对Excel文件(*.xlsx)有同样的问题,我解决了以下问题,我认为您可以对csv文件做同样的事情:-如果您的PC驱动器中有一个名为(file.xlsx)的文件,则:1-使用以下简单代码从硬盘上载:

1
2
from google.colab import files
uploaded = files.upload()

按(选择文件)并将其上传到您的谷歌驱动器。

2-然后:

1
2
import io
data = io.BytesIO(uploaded['file.XLSX'])

3-最后,阅读您的文件:

1
2
3
4
import pandas as pd  
f = pd.read_excel(data , sheet_name = '1min', header = 0, skiprows = 2)
#df.sheet_names
df.head()

4-请更改参数值以读取您自己的文件。我认为这可以概括为读取其他类型的文件!好好享受吧!


或者,也可以使用github导入文件。例如:https://drive.google.com/file/d/1d6viux8_ledfbqcxhcrfcqbvnzitwcs/view?USP=共享

此外,谷歌不会将文件保存更长时间,因此您可能需要一次又一次地运行github代码段。