python pandas 通过列名列表从数据框中选择列

作者:编程家 分类: python 时间:2025-10-23

使用Python中的Pandas库,我们可以轻松地从数据框中选择特定的列。在本文中,我们将介绍如何使用列名列表来选择我们感兴趣的列,并提供一些示例代码来帮助读者更好地理解。

在开始之前,我们首先需要导入Pandas库。我们可以使用以下代码来完成导入:

python

import pandas as pd

一旦我们导入了Pandas库,我们就可以加载我们的数据集并开始选择我们感兴趣的列。假设我们有一个名为"df"的数据框,其中包含了以下列: "姓名"、"年龄"、"性别"、"职业"、"收入"。

要选择特定的列,我们可以使用列名列表作为索引,将其传递给数据框。下面是一个选择"姓名"和"年龄"列的示例代码:

python

selected_columns = ['姓名', '年龄']

new_df = df[selected_columns]

通过上述代码,我们创建了一个新的数据框"new_df",其中包含了我们选择的"姓名"和"年龄"列。我们可以使用以下代码来查看新数据框的前几行:

python

print(new_df.head())

接下来,让我们看一下如何选择多个列。假设我们想要选择"性别"、"职业"和"收入"列。我们可以使用以下代码来实现:

python

selected_columns = ['性别', '职业', '收入']

new_df = df[selected_columns]

同样,我们创建了一个新的数据框"new_df",其中包含了我们选择的"性别"、"职业"和"收入"列。我们可以使用以下代码来查看新数据框的前几行:

python

print(new_df.head())

选择特定的列

有时候,我们可能只对数据框中的特定列感兴趣。在这种情况下,我们可以使用以下代码来选择特定的列:

python

selected_column = df['姓名']

上述代码将选择"姓名"列,并将其赋值给"selected_column"变量。我们可以使用以下代码来查看所选择的列的前几行数据:

python

print(selected_column.head())

选择列的子集

我们还可以选择列的子集,即在一组列中选择一部分列。假设我们有一个包含了10个列的数据框,我们只想选择其中的前5列。我们可以使用以下代码来实现:

python

subset_columns = df.iloc[:, :5]

上述代码使用了Pandas库中的iloc函数,它允许我们通过索引选择数据框的子集。在这种情况下,我们选择了所有行(:)和前5列(:5)。我们可以使用以下代码来查看所选择的列的前几行数据:

python

print(subset_columns.head())

在本文中,我们介绍了如何使用Python中的Pandas库通过列名列表从数据框中选择列。我们可以使用列名列表作为索引来选择我们感兴趣的列,然后创建一个新的数据框来存储这些列。我们还介绍了如何选择特定的列以及如何选择列的子集。通过这些方法,我们可以轻松地从数据框中提取我们所需的信息。希望本文对读者在使用Pandas进行数据分析时有所帮助。

示例代码:

python

import pandas as pd

# 创建一个数据框

data = {'姓名': ['小明', '小红', '小刚'],

'年龄': [20, 25, 22],

'性别': ['男', '女', '男'],

'职业': ['学生', '教师', '工程师'],

'收入': [2000, 3000, 5000]}

df = pd.DataFrame(data)

# 选择特定的列

selected_columns = ['姓名', '年龄']

new_df = df[selected_columns]

print(new_df.head())

# 选择多个列

selected_columns = ['性别', '职业', '收入']

new_df = df[selected_columns]

print(new_df.head())

# 选择特定的列

selected_column = df['姓名']

print(selected_column.head())

# 选择列的子集

subset_columns = df.iloc[:, :3]

print(subset_columns.head())

希望这篇文章对你有所帮助!