pythonimport pandas as pd# 创建示例数据表data = { '商品名称': ['商品A', '商品B', '商品C'], '销售数量': [10, 15, 20], '销售金额': [100, 150, 200], '销售金额_副本': [100, 150, 200]}df = pd.DataFrame(data)print(df)运行以上代码,我们可以看到如下输出结果:商品名称 销售数量 销售金额 销售金额_副本0 商品A 10 100 1001 商品B 15 150 1502 商品C 20 200 200在数据表中,我们可以观察到“销售金额”列和“销售金额_副本”列具有相同的数据。下面,我们将介绍一些有趣的结果。重复列的索引在
python# 引用重复列print(df['销售金额'])print(df['销售金额_副本'])输出结果如下:
0 1001 1502 200Name: 销售金额, dtype: int640 1001 1502 200Name: 销售金额_副本, dtype: int64通过索引,我们可以分别引用到两个重复的列。重复列的计算当数据表中存在重复列时,我们可以对这些列进行计算。例如,我们可以对“销售金额”列和“销售金额_副本”列进行求和操作。
python# 对重复列求和df['销售金额总和'] = df['销售金额'] + df['销售金额_副本']print(df)输出结果如下:
商品名称 销售数量 销售金额 销售金额_副本 销售金额总和0 商品A 10 100 100 2001 商品B 15 150 150 3002 商品C 20 200 200 400通过对重复列进行计算,我们可以得到新的列“销售金额总和”。重复列的删除有时候,我们可能需要删除数据表中的重复列。在
drop() 函数来删除指定的列。python# 删除重复列df = df.drop(columns=['销售金额_副本'])print(df)输出结果如下:
商品名称 销售数量 销售金额 销售金额总和0 商品A 10 100 2001 商品B 15 150 3002 商品C 20 200 400通过
drop() 函数,我们成功删除了重复列“销售金额_副本”。在本文中,我们介绍了在