pandas 使用正则表达式将列表拆分为列

使用正则表达式将列表拆分为列是一种常见的数据处理技巧，特别是在使用Python中的pandas库时。pandas是一个强大的数据分析工具，它提供了许多灵活的函数和方法，可以帮助我们高效地处理和分析数据。

在数据处理过程中，经常会遇到需要将一个包含多个值的列拆分为多个单独的列的情况。这种情况下，我们可以使用正则表达式来匹配和拆分文本，并将拆分后的结果存储到新的列中。

假设我们有一个包含多个值的列，如下所示：


import pandas as pd
# 创建示例数据
data = {'values': ['apple, orange', 'banana', 'grape, mango', 'watermelon']}
df = pd.DataFrame(data)

该列中的每个值由逗号分隔，我们希望将其拆分为两个单独的列。为了实现这个目标，我们可以使用pandas的`str.split()`函数，结合正则表达式来进行拆分。


# 使用正则表达式将列表拆分为列
df[['value1', 'value2']] = df['values'].str.split(r'\s*,\s*', expand=True)

在上述代码中，我们使用正则表达式`\s*,\s*`来匹配逗号前后的任意空格，并使用`str.split()`函数将列拆分为两个新的列。`expand=True`参数表示将拆分后的结果扩展为独立的列。

通过上述操作，我们成功将原始列拆分为两个新的列`value1`和`value2`，并将其添加到数据框中。现在，我们可以查看拆分后的结果：


print(df)

输出结果如下：

values value1 value2

0 apple, orange apple orange

1 banana banana None

2 grape, mango grape mango

3 watermelon watermelon None

可以看到，原始列中的每个值都被正确地拆分为了两个新的列。对于没有拆分结果的值，pandas会在新的列中填充`None`值。

案例代码：


import pandas as pd
# 创建示例数据
data = {'values': ['apple, orange', 'banana', 'grape, mango', 'watermelon']}
df = pd.DataFrame(data)
# 使用正则表达式将列表拆分为列
df[['value1', 'value2']] = df['values'].str.split(r'\s*,\s*', expand=True)
# 打印拆分后的结果
print(df)

运行结果：

values value1 value2

0 apple, orange apple orange

1 banana banana None

2 grape, mango grape mango

3 watermelon watermelon None

在使用正则表达式将列表拆分为列时，我们可以根据具体的需求来自定义正则表达式的模式，以适应不同的数据格式。此外，pandas还提供了许多其他强大的函数和方法，可以帮助我们更加灵活地处理和分析数据。

上一篇：pandas 中的 `re.sub()` 下一篇：Pandas 使用正则表达式选择列并按值除

=

PHP 和 regexp 仅接受表单中的希腊字符: 　　　　使用 PHP 和正则表达式，我们可以轻松地仅接受表单中的希腊字符。本文将为您展示如何实现这一功能，并提供相应的案例代码。首先，让我们来了解一下希腊字符。希腊字符是一种...... ...
PHP 和 Python 之间的 REGEX 有何不同: 　　　　PHP和Python是两种流行的编程语言，在编程领域中都有着广泛的应用。在正则表达式（REGEX）方面，PHP和Python之间存在一些差异。本文将探讨这些差异，并为读者提供一些相关的...... ...
PHP 去掉标点符号: 　　　　标题：PHP去除字符串中的标点符号案例代码PHP是一种广泛用于Web开发的脚本语言，它可以通过各种函数和技巧来处理字符串。本文将介绍如何使用PHP去除字符串中的标点符号，并...... ...
PHP 删除字符最后一个实例之前的所有内容: 　　　　PHP是一种广泛应用于Web开发的脚本语言，它提供了丰富的功能和灵活的语法，可以帮助开发人员轻松实现各种需求。在PHP中，有时我们需要删除字符串中最后一个实例之前的所有内...... ...
PHP 函数转义 MySQL 正则表达式语法: 　　　　PHP 函数转义 MySQL 正则表达式语法MySQL 正则表达式是一种强大的文本匹配工具，可以用来在数据库中进行模式匹配。然而，当我们使用 PHP 来与 MySQL 数据库交互时，我们需要...... ...
PHP 函数从查询字符串中删除键: 　　　　删除查询字符串中的键是在PHP中经常需要处理的一个问题。查询字符串是URL中的一部分，用于向服务器传递参数。有时候我们需要从查询字符串中删除某个键，以达到过滤参数或者...... ...
PHP 函数中 preg 代表什么: 　　　　在PHP中，preg是一个用于正则表达式操作的函数库。正则表达式是一种强大的模式匹配工具，它可以用来在字符串中查找、替换和提取特定的内容。PHP提供了一系列的preg函数，可...... ...
PHP 使用哪种正则表达式算法: 　　　　PHP使用的正则表达式算法是基于PCRE（Perl Compatible Regular Expressions）库的。正则表达式是一种强大的文本匹配工具，它可以用来在字符串中查找特定的模式。在PHP中，使...... ...
PHP 使用 preg_replace ：“分隔符不能是字母数字或反斜杠”错误: 　　　　使用PHP中的preg_replace函数时，有时会遇到一个常见的错误：“分隔符不能是字母数字或反斜杠”。这个错误通常在我们尝试使用正则表达式替换字符串时出现。在PHP中，preg_r...... ...
php 使用 pregmatch 只允许字母、数字、空格和特定符号: 　　　　使用 preg_match 函数可以实现对字符串的正则匹配，从而实现对特定字符的限制。在本文中，我们将介绍如何使用 preg_match 函数限制字符串只包含字母、数字、空格和特定符号...... ...
PHP 人名正则表达式: 　　　　PHP人名正则表达式详解PHP是一种广泛使用的服务器端脚本语言，它在网页开发中起着举足轻重的作用。在PHP中，我们经常需要对字符串进行处理，其中包括对人名的处理。为了方便...... ...
PHP 中解析 CSV 的正则表达式: 　　　　PHP中解析CSV的正则表达式CSV（逗号分隔值）是一种常见的文件格式，用于存储和交换以逗号作为分隔符的数据。在PHP中，解析CSV文件可以使用正则表达式来提取和处理数据。本文...... ...
PHP 中的正则表达式字边界到底是如何工作的: 　　　　PHP中的正则表达式字边界是用来匹配单词边界的标记。单词边界是指一个单词的开头或结尾，它是由非单词字符和单词字符之间的转换所定义的。在正则表达式中，字边界可以用\b来...... ...
PHP 中的正则表达式二进制模式搜索: 　　　　使用PHP中的正则表达式二进制模式搜索在PHP中，正则表达式是一种强大的工具，可以用来匹配和搜索字符串中的模式。PHP提供了许多内置的正则表达式函数，可以用来执行各种模式...... ...
PHP 中的多字节修剪: 　　　　PHP 中的多字节修剪在 PHP 中，字符串修剪是一种常见的操作，用于删除字符串开头和结尾的空格或其他特定字符。然而，当处理多字节字符时，传统的字符串修剪函数可能会出现问...... ...