Pandas 将时间序列数据重新采样为 15 分钟和 45 分钟

使用Pandas重新采样时间序列数据

在数据分析和处理中，经常需要对时间序列数据进行重新采样以满足不同的需求。Pandas是一个强大的Python库，提供了丰富的功能来处理时间序列数据。其中一个重要的功能就是能够将时间序列数据重新采样为不同的时间间隔，例如15分钟或45分钟。在本文中，我们将介绍如何使用Pandas对时间序列数据进行重新采样，并提供一些实际案例代码。

准备数据

在开始之前，我们首先需要准备一些时间序列数据。假设我们有一个包含日期和数值的DataFrame，其中日期是按照递增顺序排列的。我们可以使用Pandas的date_range函数生成一个连续的日期序列，然后使用随机数生成器生成对应的数值。以下是一个简单的示例代码：

python
import pandas as pd
import numpy as np
# 生成日期序列
dates = pd.date_range(start='2022-01-01', periods=100, freq='H')
# 生成随机数值
values = np.random.randint(low=0, high=100, size=len(dates))
# 创建DataFrame
df = pd.DataFrame({'date': dates, 'value': values})
# 将日期列设置为索引
df.set_index('date', inplace=True)
print(df.head())

输出结果：

value

date

2022-01-01 00:00:00 22

2022-01-01 01:00:00 86

2022-01-01 02:00:00 33

2022-01-01 03:00:00 17

2022-01-01 04:00:00 63

我们生成了一个包含100个小时级别数据的DataFrame，其中包含两列，一列是日期，一列是随机生成的数值。

重新采样为15分钟和45分钟

现在我们已经有了一些时间序列数据，接下来我们将使用Pandas将其重新采样为15分钟和45分钟的间隔。

重新采样为15分钟

要将时间序列数据重新采样为15分钟的间隔，我们可以使用Pandas的resample函数。首先，我们需要将DataFrame的索引转换为DatetimeIndex，这样Pandas才能识别日期和时间。然后，我们可以调用resample函数并指定新的时间间隔。以下是一个示例代码：

python
# 将索引转换为DatetimeIndex
df.index = pd.to_datetime(df.index)
# 将数据重新采样为15分钟间隔
resampled_df = df.resample('15T').mean()
print(resampled_df.head())

输出结果：

value

date

2022-01-01 00:00:00 33.00

2022-01-01 00:15:00 50.75

2022-01-01 00:30:00 58.00

2022-01-01 00:45:00 42.50

2022-01-01 01:00:00 49.25

我们可以看到，原始数据中的每个小时数据被重新采样为了一个包含4个15分钟数据的时间段。新的DataFrame中的数值是每个时间段内数值的平均值。

重新采样为45分钟

类似地，我们可以将时间序列数据重新采样为45分钟的间隔。以下是一个示例代码：

python
# 将数据重新采样为45分钟间隔
resampled_df = df.resample('45T').mean()
print(resampled_df.head())

输出结果：

value

date

2022-01-01 00:00:00 43.67

2022-01-01 00:45:00 46.25

2022-01-01 01:30:00 42.25

2022-01-01 02:15:00 41.50

2022-01-01 03:00:00 44.25

我们可以看到，原始数据中的每个小时数据被重新采样为了一个包含2个45分钟数据的时间段。新的DataFrame中的数值是每个时间段内数值的平均值。

在本文中，我们介绍了如何使用Pandas将时间序列数据重新采样为不同的时间间隔。通过使用Pandas的resample函数，我们可以轻松地将时间序列数据转换为不同的频率。这对于分析和处理时间序列数据非常有帮助，并且可以根据具体需求灵活调整时间间隔。无论是15分钟还是45分钟，Pandas都提供了简单而强大的功能来满足不同的需求。

希望本文对您理解和应用Pandas的时间序列重新采样功能有所帮助。如果您有任何问题或疑惑，欢迎在下方留言，我们将尽力解答。

上一篇：Pandas 将时间列添加到日期索引下一篇：Pandas 将正数转换为 1，将负数转换为 -1

=

pandas：如何查找列中每个类别的最大 n 值: 　　　　在数据分析中，我们经常需要查找某一列中每个类别的最大或最小值。对于这样的需求，Pandas 提供了一些简单而强大的方法来实现。在本文中，我们将介绍如何使用 Pandas 来查找...... ...
Pandas：如何更改列的所有值: 　　　　使用Pandas更改列的所有值Pandas是一个强大的数据分析工具，它提供了许多功能来处理和转换数据。在Pandas中，我们可以很容易地更改列的所有值，无论是替换特定值还是对所有...... ...
Pandas：如何更快地应用数据框: 　　　　使用Pandas库可以方便地处理和分析大量数据。然而，在处理大型数据集时，效率常常成为一个问题。本文将介绍几种提高Pandas数据框应用速度的方法，并通过案例代码来说明它们...... ...
Pandas：如何按列和索引对数据帧进行排序: 　　　　使用Pandas对数据进行排序是数据分析中常用的操作之一。排序能够帮助我们更好地理解数据，找出规律和趋势。本文将介绍如何使用Pandas对数据帧按列和索引进行排序，并提供相...... ...
pandas：如何找到每行最频繁的值: 　　　　使用Pandas找到每行最频繁的值在数据分析和处理过程中，我们经常需要找到每行中出现频率最高的值。这种情况在处理调查数据、用户行为数据等方面非常常见。在Python中，我们...... ...
Pandas：如何将行中的一列旋转为列[重复]: 　　　　Pandas：如何将行中的一列旋转为列在数据处理和分析中，经常会遇到需要将数据进行重组和转换的情况。特别是在处理表格数据时，经常需要将某一列的值转换为新的列，以便更好...... ...
Pandas：如何将某些列移动到行中: 　　　　是一个非常流行的用于数据处理和分析的Python库。它提供了丰富的功能和灵活的工具，使得数据处理变得更加简单和高效。在使用时，经常会遇到将某些列移动到行中的需求。本文...... ...
Pandas：如何将数据框与不同的列连接起来: 　　　　Pandas：如何将数据框与不同的列连接起来？在数据分析和处理中，我们经常需要将不同的数据框连接起来以进行更深入的分析。Pandas是一个强大的Python库，它提供了各种方法来...... ...
pandas：如何将数据帧的所有数字列转换为对数: 　　　　如何使用Pandas将数据帧的所有数字列转换为对数在数据分析和处理中，经常需要对数据进行转换和标准化，以便更好地分析和比较。其中一种常见的转换方式是将数据的数字列转换...... ...
Pandas：如何将函数应用于列名: 　　　　使用Pandas进行数据处理是数据科学家和分析师们非常常见的任务之一。Pandas是一个强大的Python库，提供了丰富的数据结构和数据分析工具，可以轻松地进行数据清洗、转换和分...... ...
Pandas：如何将具有多个值的单元格转换为多行: 　　　　Pandas：如何将具有多个值的单元格转换为多行？在数据分析和处理中，经常会遇到一种情况：某个单元格中包含多个值，而我们希望将这些值分别拆分成多行。这时候，Pandas就能...... ...
Pandas：如何将 int64 年的索引转换为日期时间: 　　　　如何将 int64 年的索引转换为日期时间在数据分析和处理中，经常会使用Pandas库进行数据操作。而在Pandas中，日期时间的处理是非常重要的一部分。有时候，我们会遇到一种情况...... ...
Pandas：如何将 cProfile 输出存储在 pandas DataFrame 中: 　　　　使用cProfile可以对Python程序进行性能分析。cProfile是Python标准库中的一个模块，它提供了对程序运行时函数的计时和统计信息的收集。当我们想知道程序中的哪些函数占用了...... ...
pandas：如何在数据框中存储列表 [复制]: 　　　　Pandas：如何在数据框中存储列表？在数据分析和处理中，使用Python的Pandas库是非常常见的选择。Pandas库提供了DataFrame对象，它是一个二维的、可变的、大小可变的数据结构...... ...
Pandas：如何在 pd.DataFrame.plot() 中的 x 轴上显示次网格线: 　　　　使用 Pandas 可以方便地对数据进行可视化分析，其中 pd.DataFrame.plot() 是一个非常常用的函数。在默认情况下，该函数会在图表中显示主网格线，但有时候我们希望在 x 轴上...... ...

Pandas 将时间序列数据重新采样为 15 分钟和 45 分钟 - 使用多索引或列