Pandas 从字符串中提取数字

作者:编程家 分类: pandas 时间:2025-04-13

使用Pandas从字符串中提取数字

在数据处理和分析过程中,经常会遇到需要从字符串中提取数字的情况。使用Python中的Pandas库,可以方便地实现这一操作。本文将介绍如何使用Pandas从字符串中提取数字,并提供一个案例代码。

案例代码:

首先,我们需要导入Pandas库并创建一个包含字符串的数据框。假设我们有一个包含产品名称和价格的数据框,其中价格以字符串的形式表示。

python

import pandas as pd

data = {'产品名称': ['苹果', '香蕉', '橙子'],

'价格': ['¥5.99', '¥3.50', '¥2.80']}

df = pd.DataFrame(data)

print(df)

输出结果为:

产品名称 价格

0 苹果 ¥5.99

1 香蕉 ¥3.50

2 橙子 ¥2.80

接下来,我们可以使用Pandas的`str.extract()`方法从字符串中提取数字。在`extract()`方法中,我们可以使用正则表达式来指定要提取的数字的模式。

python

df['价格'] = df['价格'].str.extract('(\d+.\d+)')

print(df)

输出结果为:

产品名称 价格

0 苹果 5.99

1 香蕉 3.50

2 橙子 2.80

可以看到,原始的价格字符串中的货币符号已被去除,只剩下了数字部分。

使用Pandas从字符串中提取数字

在数据处理和分析中,从字符串中提取数字是一项常见的任务。例如,当我们需要对产品价格进行统计分析时,就需要将价格从字符串中提取出来,并转化为数字类型。

Pandas是一个强大的数据处理库,它提供了各种灵活的方法来处理字符串数据。其中,`str.extract()`方法可以用于从字符串中提取数字。

案例代码:

假设我们有一个包含产品名称和价格的数据框,其中价格以字符串的形式表示。我们想要将价格从字符串中提取出来,并转化为数字类型,以便进行后续的统计分析。

首先,我们需要导入Pandas库并创建一个包含字符串的数据框。

python

import pandas as pd

data = {'产品名称': ['苹果', '香蕉', '橙子'],

'价格': ['¥5.99', '¥3.50', '¥2.80']}

df = pd.DataFrame(data)

print(df)

输出结果为:

产品名称 价格

0 苹果 ¥5.99

1 香蕉 ¥3.50

2 橙子 ¥2.80

接下来,我们可以使用Pandas的`str.extract()`方法从字符串中提取数字。在`extract()`方法中,我们可以使用正则表达式来指定要提取的数字的模式。

python

df['价格'] = df['价格'].str.extract('(\d+.\d+)')

print(df)

输出结果为:

产品名称 价格

0 苹果 5.99

1 香蕉 3.50

2 橙子 2.80

可以看到,原始的价格字符串中的货币符号已被去除,只剩下了数字部分。现在,我们可以将提取出的价格转化为数字类型,并进行后续的统计分析了。

通过使用Pandas库中的`str.extract()`方法,我们可以方便地从字符串中提取数字。这对于数据处理和分析中的各种任务都非常有用,例如将价格从字符串中提取出来,并进行统计分析。希望本文的介绍和案例代码对你有所帮助!