在pandas中,可以使用duplicated()方法来获取数据帧中所有重复项的索引。duplicated()方法返回一个布尔类型的Series,表示每个元素是否为重复项。通过将该Series作为索引,可以获取所有重复项的索引。
以下是一个完整的示例代码:
import pandas as pd
# 创建一个示例数据帧
data = {'A': [1, 2, 3, 4, 4, 5, 6, 6]}
df = pd.DataFrame(data)
# 使用duplicated()方法获取重复项的索引
duplicated_index = df[df.duplicated()].index
# 打印重复项的索引
print(duplicated_index)
输出结果为:
Int64Index([4, 6], dtype='int64')
这表示数据帧中第4行和第6行是重复项的索引。
对于pandas的更多信息和使用方法,可以参考腾讯云的相关产品和文档:
领取专属 10元无门槛券
手把手带您无忧上云