在pandas中,可以使用drop_duplicates()
方法创建一个从没有重复的列中获取唯一值的数据帧。
具体步骤如下:
import pandas as pd
col1
和col2
是两列数据,其中col2
包含重复值。drop_duplicates()
方法创建一个新的数据帧,其中包含从没有重复的col2
列中获取的唯一值:unique_df = df.drop_duplicates(subset='col2')这里的subset='col2'
表示只考虑col2
列的重复值。这样就创建了一个从没有重复的列中获取唯一值的pandas数据帧。
推荐的腾讯云相关产品:腾讯云数据库TDSQL、腾讯云数据仓库CDW、腾讯云数据传输服务DTS。
腾讯云产品介绍链接地址:
“中小企业”在线学堂
DB TALK 技术分享会
DBTalk
Elastic 实战工作坊
Elastic 实战工作坊
云原生正发声
云+社区开发者大会 长沙站
云+社区技术沙龙[第9期]
云+社区技术沙龙[第27期]
Elastic 中国开发者大会
领取专属 10元无门槛券
手把手带您无忧上云