Python - 如何将 JSON 文件转换为 Dataframe

作者:编程家 分类: python 时间:2025-09-16

在Python中,我们经常需要处理JSON数据。JSON(JavaScript Object Notation)是一种常用的数据格式,用于存储和交换数据。在数据分析和机器学习的领域中,我们经常需要将JSON文件转换为DataFrame,以便进行数据处理和分析。本文将介绍如何使用Python将JSON文件转换为DataFrame,并提供一个案例代码来帮助读者更好地理解。

为什么要将JSON文件转换为DataFrame?

在数据分析和机器学习的领域中,DataFrame是一种常用的数据结构。它类似于Excel表格,可以将数据组织成行和列的形式,方便进行数据处理和分析。而JSON文件是一种常见的数据存储格式,它可以存储复杂的数据结构,包括嵌套的列表和字典。因此,将JSON文件转换为DataFrame可以方便地进行数据处理和分析。

如何将JSON文件转换为DataFrame?

在Python中,我们可以使用pandas库来处理数据,包括将JSON文件转换为DataFrame。首先,我们需要导入pandas库:

python

import pandas as pd

然后,我们可以使用pandas的`read_json()`函数来读取JSON文件,并将其转换为DataFrame。例如,我们有一个名为`data.json`的JSON文件,包含以下数据:

json

[

{"name": "Alice", "age": 25, "city": "New York"},

{"name": "Bob", "age": 30, "city": "San Francisco"},

{"name": "Charlie", "age": 35, "city": "Los Angeles"}

]

我们可以使用以下代码将该JSON文件转换为DataFrame:

python

df = pd.read_json('data.json')

这样,我们就成功将JSON文件转换为DataFrame了。我们可以使用`df.head()`函数来查看DataFrame的前几行数据:

python

print(df.head())

输出结果为:

name age city

0 Alice 25 New York

1 Bob 30 San Francisco

2 Charlie 35 Los Angeles

案例代码

接下来,我们将演示一个完整的案例代码,来将一个包含学生信息的JSON文件转换为DataFrame。假设我们有一个名为`students.json`的JSON文件,包含以下数据:

json

[

{"name": "Alice", "age": 25, "city": "New York", "major": "Computer Science"},

{"name": "Bob", "age": 30, "city": "San Francisco", "major": "Data Science"},

{"name": "Charlie", "age": 35, "city": "Los Angeles", "major": "Statistics"}

]

我们可以使用以下代码将该JSON文件转换为DataFrame,并进行一些基本的数据处理和分析:

python

import pandas as pd

# 读取JSON文件并转换为DataFrame

df = pd.read_json('students.json')

# 查看DataFrame的前几行数据

print(df.head())

# 统计学生的平均年龄

avg_age = df['age'].mean()

print("平均年龄:", avg_age)

# 统计每个专业的学生人数

major_count = df['major'].value_counts()

print("每个专业的学生人数:")

print(major_count)

输出结果为:

name age city major

0 Alice 25 New York Computer Science

1 Bob 30 San Francisco Data Science

2 Charlie 35 Los Angeles Statistics

平均年龄: 30.0

每个专业的学生人数:

Data Science 1

Computer Science 1

Statistics 1

Name: major, dtype: int64

通过以上案例代码,我们可以看到,将JSON文件转换为DataFrame后,我们可以方便地进行数据处理和分析,比如统计学生的平均年龄和每个专业的学生人数。

本文介绍了如何使用Python将JSON文件转换为DataFrame,并提供了一个案例代码来帮助读者更好地理解。将JSON文件转换为DataFrame可以方便地进行数据处理和分析,是数据分析和机器学习的重要步骤之一。希望本文对读者能有所帮助,谢谢!