GROUP BY 列相等或 NULL 的连续行

GROUP BY 列相等或 NULL 的连续行

在数据库中，我们经常需要对数据进行分组，并根据某个列的值进行聚合计算。通常情况下，我们使用GROUP BY子句来实现这个功能。但是在某些情况下，我们可能希望将连续的行分组，即将连续的具有相同值或NULL值的行聚合在一起。本文将介绍如何使用GROUP BY列相等或NULL的连续行，并提供相应的案例代码。

案例代码：

假设我们有一个名为"orders"的表，包含以下列：order_id、customer_id和order_status。我们希望按照customer_id进行分组，并将具有相同customer_id的连续行聚合在一起。

首先，我们创建一个示例表并插入一些数据：

sql
CREATE TABLE orders (
    order_id INT,
    customer_id INT,
    order_status VARCHAR(10)
);
INSERT INTO orders (order_id, customer_id, order_status)
VALUES (1, 1, 'completed'),
       (2, 1, 'cancelled'),
       (3, 2, 'completed'),
       (4, 2, 'completed'),
       (5, 3, 'cancelled'),
       (6, 3, 'completed');

现在，我们可以使用GROUP BY和窗口函数来实现按照customer_id分组，并将具有相同customer_id的连续行聚合在一起。以下是相应的查询语句：

sql
SELECT MIN(order_id) AS start_order_id,
       MAX(order_id) AS end_order_id,
       customer_id,
       MIN(order_status) AS order_status
FROM (
    SELECT order_id,
           customer_id,
           order_status,
           ROW_NUMBER() OVER (ORDER BY order_id) -
           ROW_NUMBER() OVER (PARTITION BY customer_id, order_status ORDER BY order_id) AS grp
    FROM orders
) sub
GROUP BY customer_id, grp
ORDER BY MIN(order_id);

这个查询语句使用两个窗口函数来计算一个“分组”列（grp）。首先，我们使用ORDER BY子句对order_id进行排序，并使用ROW_NUMBER()函数为每一行分配一个行号。然后，我们使用PARTITION BY子句将行按照customer_id和order_status进行分区，并再次使用ROW_NUMBER()函数为每个分区分配一个行号。通过将这两个行号相减，我们可以得到一个连续的行号，用于标识具有相同customer_id的连续行。最后，我们使用GROUP BY子句将结果按照customer_id和grp进行分组，并使用MIN()和MAX()函数获取每个分组的起始和结束order_id，以及相应的customer_id和order_status。

使用GROUP BY列相等或NULL的连续行的好处

使用GROUP BY列相等或NULL的连续行可以帮助我们更好地理解和分析数据。通过将具有相同值或NULL值的连续行聚合在一起，我们可以更轻松地进行统计和计算。例如，在上面的示例中，我们可以使用这种方法计算每个customer_id的订单数量，或者计算每个customer_id的订单完成率等。

在本文中，我们介绍了如何使用GROUP BY列相等或NULL的连续行，并提供了相应的案例代码。通过将具有相同值或NULL值的连续行聚合在一起，我们可以更方便地进行数据分析和计算。这种方法在数据库查询中非常有用，可以帮助我们更好地理解和利用数据。

上一篇：SQL 更新查询中的聚合函数下一篇：GROUP BY 包括 0（如果不存在）

=

GROUP BY 后的 ORDER BY 不起作用: 　　　　GROUP BY 后的 ORDER BY 不起作用在数据库中，GROUP BY 语句用于将结果集按照指定的列进行分组。而ORDER BY 语句用于对结果集进行排序。然而，在某些情况下，我们可能会遇到...... ...
GROUP BY 同一列中的多个值: 　　　　使用 GROUP BY 对同一列中的多个值进行分组在数据分析和数据库查询中，我们经常需要对数据进行分组和聚合，以便更好地理解和分析数据。而在某些情况下，我们可能需要对同一...... ...
GROUP BY 包括 0（如果不存在）: 　　　　在进行数据分析和报告生成时，经常需要对数据进行分组统计。GROUP BY 是一种常用的操作，它可以根据指定的列对数据进行分组，并对每个分组进行聚合操作，例如求和、平均值等...... ...
GROUP BY 列相等或 NULL 的连续行: 　　　　GROUP BY 列相等或 NULL 的连续行在数据库中，我们经常需要对数据进行分组，并根据某个列的值进行聚合计算。通常情况下，我们使用GROUP BY子句来实现这个功能。但是在某些情...... ...
SQL 更新查询中的聚合函数: 　　　　根据 SQL 更新查询中的聚合函数在数据处理和分析中，SQL是一种常用的查询语言，可以用来从数据库中检索和更新数据。SQL提供了各种聚合函数，如SUM、COUNT、AVG等，用于对数...... ...
SQL 更新查询 - 聚合可能不会出现在 UPDATE 语句的集合列表中: 　　　　SQL 更新查询 - 聚合可能不会出现在 UPDATE 语句的集合列表中在使用 SQL 进行数据库操作时，经常需要使用更新查询来修改表中的数据。更新查询语句通常使用 UPDATE 关键字，...... ...
SQL 更新期间违反 UNIQUE KEY 约束: 　　　　SQL 更新期间违反 UNIQUE KEY 约束在数据库管理系统中，UNIQUE KEY 约束用于确保表中的某个列或一组列的值是唯一的。当我们在更新数据时，有时会遇到违反 UNIQUE KEY 约束的...... ...
SQL 更改选择中的字段排序规则: 　　　　使用SQL语言可以对数据库中的数据进行各种操作，包括查询、插入、更新和删除等。其中，查询操作是使用最频繁的功能之一，我们可以使用SQL语句对数据库中的数据进行筛选和排...... ...
GROUP BY 列名而不在 SELECT 列表中选择它: 　　　　使用GROUP BY子句可以对查询结果按照指定列进行分组，并对每个分组进行聚合操作。在SELECT列表中可以选择需要展示的列，但是有时候我们可能需要根据某一列进行分组，而不在...... ...
GROUP BY 但获取其他列的所有值: 　　　　如何在 GROUP BY 子句中获取其他列的所有值在进行 SQL 数据库查询时，我们经常会使用 GROUP BY 子句来对数据进行分组。然而，有时我们需要获取除了分组列之外的其他列的所有...... ...
group by 会减慢查询速度: 　　　　使用 group by 语句可以对数据库中的数据进行分组统计，但是在某些情况下，使用 group by 会导致查询速度变慢。本文将探讨 group by 的使用场景以及其对查询速度的影响，并...... ...
GROUP BY 仅包含一列序列的第一行: 　　　　GROUP BY 仅包含一列序列的第一行？在SQL中，GROUP BY语句用于对查询结果进行分组，根据指定的列或表达式将结果划分为多个组。然而，有时候我们可能只需要每个组中的第一行...... ...
SQL 日期时间比较: 　　　　SQL 日期时间比较在SQL中，日期和时间是常见的数据类型。我们经常需要在查询中对日期和时间进行比较和计算。在本文中，我们将学习如何使用SQL进行日期和时间的比较，并提供...... ...
SQL 日期时间格式仅限日期: 　　　　SQL日期时间格式仅限日期的使用方法在使用SQL语言进行数据处理和查询时，日期和时间的处理是非常常见的需求之一。然而，有时候我们只需要关注日期，而不需要具体的时间信息...... ...
SQL 效率：WHERE IN 子查询与 JOIN then GROUP: 　　　　SQL 效率：WHERE IN 子查询与 JOIN then GROUP在进行 SQL 数据库查询时，我们经常需要根据某些条件过滤数据，并对结果进行分组。然而，如何以最高效的方式完成这些操作是一...... ...