pythonimport pandas as pd# 创建一个包含多个列的数据集data = {'col1': [1, 2, 3, 4, 5], 'col2': ['a', 'b', 'c', 'd', 'e'], 'col3': [1, 2, 3, 4, 5]}df = pd.DataFrame(data)# 查找多列的唯一值unique_values = df.drop_duplicates(subset=['col1', 'col2', 'col3'])print(unique_values)运行以上代码,我们可以得到一个包含所有列组合后的唯一值的数据集。在实际应用中,我们往往需要对唯一值进行进一步的统计和分析。
pythonimport pandas as pd# 创建一个包含多个列的数据集data = {'col1': [1, 2, 3, 4, 5], 'col2': ['a', 'b', 'c', 'd', 'e'], 'col3': [1, 2, 3, 4, 5]}df = pd.DataFrame(data)# 统计多列唯一值的出现次数value_counts = df.groupby(['col1', 'col2', 'col3']).size().reset_index(name='count')print(value_counts)运行以上代码,我们可以得到一个包含每个唯一值和对应出现次数的数据集。案例代码:查找多列唯一值和统计出现次数下面是一个综合运用的示例,展示了如何同时查找多列的唯一值和统计每个唯一值的出现次数:
pythonimport pandas as pd# 创建一个包含多个列的数据集data = {'col1': [1, 2, 3, 4, 5], 'col2': ['a', 'b', 'c', 'd', 'e'], 'col3': [1, 2, 3, 4, 5]}df = pd.DataFrame(data)# 查找多列的唯一值unique_values = df.drop_duplicates(subset=['col1', 'col2', 'col3'])# 统计多列唯一值的出现次数value_counts = df.groupby(['col1', 'col2', 'col3']).size().reset_index(name='count')print("多列的唯一值:")print(unique_values)print("多列唯一值的出现次数:")print(value_counts)运行以上代码,我们可以得到多列的唯一值和每个唯一值的出现次数。在本文中,我们介绍了如何使用