R 中的 dplyr mutate - 添加列作为列的串联

作者:编程家 分类: ruby 时间:2025-08-15

使用R中的dplyr包中的mutate函数,我们可以在数据框中添加新的列,并将列的值设置为其他列的串联。这种操作对于数据处理和分析非常有用,可以帮助我们更好地理解和探索数据。

添加列作为列的串联的语法如下:

mutate(df, new_column = paste(column1, column2, sep = ""))

其中,df是要进行操作的数据框,new_column是新添加的列名,column1和column2是要进行串联的两列。

下面,我们将通过一个案例来演示如何使用mutate函数进行列的串联。

假设我们有一个包含学生姓名和年龄的数据框,现在我们想要添加一个新的列,将学生姓名和年龄串联在一起作为学生的标识。

首先,让我们创建一个包含学生姓名和年龄的数据框:

R

# 创建数据框

df <- data.frame(name = c("张三", "李四", "王五"),

age = c(18, 19, 20))

print(df)

输出结果为:

name age

1 张三 18

2 李四 19

3 王五 20

接下来,我们使用mutate函数将姓名和年龄串联在一起,并将结果保存在一个新的列中:

R

# 添加新列

df <- mutate(df, student_id = paste(name, age, sep = "_"))

print(df)

输出结果为:

name age student_id

1 张三 18 张三_18

2 李四 19 李四_19

3 王五 20 王五_20

可以看到,新的列student_id成功地被添加到了数据框中,每个学生的标识由姓名和年龄串联而成。

通过使用dplyr包中的mutate函数,我们可以方便地在数据框中添加新的列,并将列的值设置为其他列的串联。这种操作非常简单且灵活,可以满足我们对数据处理和分析的需求。

案例代码:

R

# 导入dplyr包

library(dplyr)

# 创建数据框

df <- data.frame(name = c("张三", "李四", "王五"),

age = c(18, 19, 20))

# 添加新列

df <- mutate(df, student_id = paste(name, age, sep = "_"))

print(df)

输出结果为:

name age student_id

1 张三 18 张三_18

2 李四 19 李四_19

3 王五 20 王五_20

【这个案例介绍了如何使用dplyr包中的mutate函数在R中添加新的列,并将列的值设置为其他列的串联。该操作对于数据处理和分析非常有用,可以帮助我们更好地理解和探索数据】