Pandas:如何从 Google Drive public 读取 CSV 文件

作者:编程家 分类: pandas 时间:2025-12-12

使用Pandas从Google Drive public读取CSV文件

在数据分析和处理中,Pandas是一个非常强大的Python库。它提供了各种功能和工具,使得数据操作变得更加简单和高效。在本文中,我们将探讨如何使用Pandas从Google Drive的公共目录中读取CSV文件。

连接Google Drive API

首先,我们需要连接到Google Drive API,以便能够访问公共目录中的文件。为了做到这一点,我们需要一个Google帐户和一些凭据。以下是一些简单的步骤:

1. 创建一个Google帐户(如果你还没有)并登录到Google开发者控制台(https://console.developers.google.com)。

2. 创建一个新的项目,并为该项目启用Google Drive API。

3. 在“凭据”选项卡下创建一个新的OAuth客户端ID,并选择应用程序类型为“桌面应用程序”。

4. 下载JSON格式的凭据文件,并将其保存在你的工作目录中。

安装Pandas和Google Auth库

要使用Pandas和Google Drive API,我们需要安装Pandas库和Google Auth库。可以通过以下命令在终端中安装这些库:

pip install pandas google-auth

读取CSV文件

现在,我们已经完成了连接到Google Drive API的准备工作,我们可以开始读取CSV文件了。首先,我们需要导入必要的库:

python

import pandas as pd

from google.oauth2 import service_account

接下来,我们需要使用先前下载的凭据文件来创建一个凭据对象:

python

credentials = service_account.Credentials.from_service_account_file('credentials.json')

然后,我们可以使用凭据对象来读取CSV文件。假设我们的CSV文件名为"data.csv",并且位于Google Drive的公共目录中:

python

file_id = 'your_file_id'

url = f'https://drive.google.com/uc?id={file_id}'

df = pd.read_csv(url)

在上面的代码中,你需要将"your_file_id"替换为你的CSV文件的实际文件ID。你可以在Google Drive上找到文件ID,方法是打开文件并复制URL中的文件ID部分。

示例代码

下面是一个完整的示例代码,演示了如何使用Pandas从Google Drive的公共目录中读取CSV文件:

python

import pandas as pd

from google.oauth2 import service_account

# 创建凭据对象

credentials = service_account.Credentials.from_service_account_file('credentials.json')

# 读取CSV文件

file_id = 'your_file_id'

url = f'https://drive.google.com/uc?id={file_id}'

df = pd.read_csv(url)

# 打印数据框

print(df.head())

本文介绍了如何使用Pandas从Google Drive的公共目录中读取CSV文件。首先,我们连接到Google Drive API并安装所需的库。然后,我们使用凭据对象读取CSV文件。希望这篇文章对你在使用Pandas进行数据分析和处理时有所帮助!