在pandas dataframe中查找重复项并打印它们的方法如下:
import pandas as pd
df = pd.DataFrame({'col1': [1, 2, 3, 3, 4, 5],
'col2': ['a', 'b', 'c', 'c', 'd', 'e']})
duplicates = df.duplicated()
print(df[duplicates])
完整的代码如下:
import pandas as pd
df = pd.DataFrame({'col1': [1, 2, 3, 3, 4, 5],
'col2': ['a', 'b', 'c', 'c', 'd', 'e']})
duplicates = df.duplicated()
print(df[duplicates])
这段代码会输出dataframe中的重复项,其中重复项的判断是基于所有列的数值进行比较。如果想要针对特定列进行重复项的查找,可以使用subset参数指定列名。
推荐的腾讯云相关产品:腾讯云数据库TDSQL,它是一种高性能、高可用、分布式的云数据库产品,支持MySQL和PostgreSQL引擎,可以满足各种规模的业务需求。产品介绍链接地址:https://cloud.tencent.com/product/tdsql
领取专属 10元无门槛券
手把手带您无忧上云