read csv to dataframe in google colab
我正在尝试读取存储在本地计算机上的csv文件。(仅供参考,这里是Kaggle的泰坦尼克号数据。)
从这个问题和答案中,我了解到您可以使用这个代码导入数据,这对我来说很好。
1 2 | from google.colab import files uploaded = files.upload() |
我迷失的地方是如何将它从这里转换为数据帧。上面答案中列出的谷歌笔记本的示例页面并没有提到它。
我正在尝试使用
综上所述,我的问题是:
1 2 | How do I convert a csv file stored locally on my files to pandas datframe on google-colaboratory? |
号
大熊猫
下面是一个完整的例子:https://colab.research.google.com/notebook fileid=1jmwtf5omsghc-y3-bkvxlan0zyxqcjjf
关键代码段是:
1 2 3 4 5 | import pandas as pd import io df = pd.read_csv(io.StringIO(uploaded['train.csv'].decode('utf-8'))) df |
步骤1-将您的Google驱动器安装到合作伙伴
1 2 | from google.colab import drive drive.mount('/content/gdrive') |
。
第2步-现在您将在左窗格(文件资源管理器)中看到您的谷歌驱动器文件。右键单击需要导入的文件并选择?opy路径。然后像往常一样导入熊猫,使用这个复制的路径。
1 2 | import pandas as pd df=pd.read_csv('gdrive/My Drive/data.csv') |
完成!
这对我很有用:
1 2 3 4 5 6 7 8 9 10 11 12 | from google.colab import auth auth.authenticate_user() from pydrive.drive import GoogleDrive from pydrive.auth import GoogleAuth from oauth2client.client import GoogleCredentials gauth = GoogleAuth() gauth.credentials = GoogleCredentials.get_application_default() drive = GoogleDrive(gauth) myfile = drive.CreateFile({'id': '!!!YOUR FILE ID!!!'}) myfile.GetContentFile('file.csv') |
将
1 2 | import pandas as pd frm = pd.read_csv('file.csv', header=None) |
。
colab google:从你的电脑上传csv我对Excel文件(*.xlsx)有同样的问题,我解决了以下问题,我认为您可以对csv文件做同样的事情:-如果您的PC驱动器中有一个名为(file.xlsx)的文件,则:1-使用以下简单代码从硬盘上载:
1 2 | from google.colab import files uploaded = files.upload() |
号
按(选择文件)并将其上传到您的谷歌驱动器。
2-然后:
1 2 | import io data = io.BytesIO(uploaded['file.XLSX']) |
3-最后,阅读您的文件:
1 2 3 4 | import pandas as pd f = pd.read_excel(data , sheet_name = '1min', header = 0, skiprows = 2) #df.sheet_names df.head() |
。
4-请更改参数值以读取您自己的文件。我认为这可以概括为读取其他类型的文件!好好享受吧!
或者,也可以使用github导入文件。例如:https://drive.google.com/file/d/1d6viux8_ledfbqcxhcrfcqbvnzitwcs/view?USP=共享
此外,谷歌不会将文件保存更长时间,因此您可能需要一次又一次地运行github代码段。