R 函数(如 str()、summary() 和 head())的 Python pandas 等价物是什么

作者:编程家 分类: ruby 时间:2025-10-29

在Python中,pandas是一个功能强大的数据处理库,它提供了与R语言中的函数相似的功能。在R中,我们可以使用一些函数如str()、summary()和head()来查看数据的结构、统计摘要和前几行。那么在pandas中,我们该如何实现类似的功能呢?本文将介绍pandas中与这些R函数等价的函数,并通过案例代码进行演示。

1. 查看数据结构 - str()

在R中,我们可以使用str()函数来查看数据的结构,包括每个变量的类型和前几行的值。在pandas中,我们可以使用info()函数来实现相同的功能。

python

import pandas as pd

# 创建一个DataFrame

data = {'Name': ['John', 'Alice', 'Bob'],

'Age': [25, 30, 35],

'Gender': ['Male', 'Female', 'Male']}

df = pd.DataFrame(data)

# 使用info()函数查看数据结构

print(df.info())

输出结果:

RangeIndex: 3 entries, 0 to 2

Data columns (total 3 columns):

Name 3 non-null object

Age 3 non-null int64

Gender 3 non-null object

dtypes: int64(1), object(2)

memory usage: 200.0+ bytes

None

2. 统计摘要 - summary()

在R中,我们可以使用summary()函数来获取数据的统计摘要信息,包括均值、中位数、最小值、最大值等。在pandas中,我们可以使用describe()函数来实现相同的功能。

python

import pandas as pd

# 创建一个DataFrame

data = {'Name': ['John', 'Alice', 'Bob'],

'Age': [25, 30, 35],

'Gender': ['Male', 'Female', 'Male']}

df = pd.DataFrame(data)

# 使用describe()函数获取统计摘要信息

print(df.describe())

输出结果:

Age

count 3.000000

mean 30.000000

std 5.773503

min 25.000000

25% 27.500000

50% 30.000000

75% 32.500000

max 35.000000

3. 查看前几行 - head()

在R中,我们可以使用head()函数来查看数据的前几行。在pandas中,我们同样可以使用head()函数来实现相同的功能。

python

import pandas as pd

# 创建一个DataFrame

data = {'Name': ['John', 'Alice', 'Bob'],

'Age': [25, 30, 35],

'Gender': ['Male', 'Female', 'Male']}

df = pd.DataFrame(data)

# 使用head()函数查看前几行

print(df.head())

输出结果:

Name Age Gender

0 John 25 Male

1 Alice 30 Female

2 Bob 35 Male

通过以上的案例代码,我们可以看到在pandas中,我们可以使用info()、describe()和head()函数来实现与R中str()、summary()和head()函数相似的功能。这些函数是pandas中非常有用的工具,可以帮助我们更好地理解和分析数据。无论是在数据探索阶段还是在数据预处理阶段,这些函数都是我们经常使用的工具之一。