Pandas 数据帧到 JSONL(JSON 行)的转换

作者:编程家 分类: pandas 时间:2025-07-01

使用Pandas库可以轻松地将数据帧转换为JSONL(JSON行)格式,这在数据处理和存储中非常有用。JSONL是一种每行包含一个独立JSON对象的格式,非常适合处理大量结构化数据。本文将为您介绍如何使用Pandas将数据帧转换为JSONL,并提供一个案例代码进行演示。

案例代码:

首先,我们需要导入必要的库,包括Pandas库和json库:

python

import pandas as pd

import json

接下来,我们创建一个包含一些示例数据的数据帧:

python

data = {'Name': ['John', 'Emma', 'Ryan', 'Sophia'],

'Age': [25, 28, 30, 27],

'City': ['New York', 'London', 'Tokyo', 'Paris']}

df = pd.DataFrame(data)

这个数据帧包含了四个人的姓名、年龄和所在城市。

现在,我们可以使用Pandas的`to_json()`函数将数据帧转换为JSONL格式。我们需要指定`orient='records'`参数,以确保每一行都被转换为一个独立的JSON对象:

python

json_data = df.to_json(orient='records', lines=True)

在这里,`orient='records'`表示将每一行转换为一个JSON对象,`lines=True`表示每个JSON对象都作为一行输出。

最后,我们可以将JSONL数据写入文件中,以便后续使用或存储:

python

with open('output.jsonl', 'w') as file:

file.write(json_data)

现在,我们已经成功将数据帧转换为JSONL格式并保存到文件中。

使用Pandas将数据帧转换为JSONL的过程如下:

1. 导入Pandas库和json库。

2. 创建一个包含示例数据的数据帧。

3. 使用`to_json()`函数将数据帧转换为JSONL格式,指定`orient='records'`参数。

4. 将JSONL数据写入文件中。

代码演示:

python

import pandas as pd

import json

# 创建示例数据帧

data = {'Name': ['John', 'Emma', 'Ryan', 'Sophia'],

'Age': [25, 28, 30, 27],

'City': ['New York', 'London', 'Tokyo', 'Paris']}

df = pd.DataFrame(data)

# 将数据帧转换为JSONL格式

json_data = df.to_json(orient='records', lines=True)

# 将JSONL数据写入文件中

with open('output.jsonl', 'w') as file:

file.write(json_data)

以上是使用Pandas将数据帧转换为JSONL格式的简单示例。您可以根据自己的需求调整数据帧和输出文件的路径。通过这种方法,您可以轻松地将结构化数据以JSONL格式进行存储和处理。