首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Pandas知识点-算术运算函数

() df1.pow(df2) 计算df1的df2次方,df1^df2 rpow() df1.rpow(df2) 计算df2的df1次方,df2^df1 在Pandas中,这些函数的用法和运算规则都相同...两个DataFrame相加,如果DataFrame的形状和对应的索引都一样,直接将对应位置(按行索引和列索引确定位置)的数据相加,得到一个新的DataFrame。 2....fillna(value): 运算出结果后,将所有空值的位置都填充成指定值。 在算术运算函数中,可以使用fill_value参数,在运算前先填充数据。 ?...两个Series相加,如果形状和索引都一样,直接将对应位置(按行索引确定位置)的数据相加,得到一个新的Series。 2. 两个形状或索引不一样的Series进行运算 ?...其中Series可以按行运算,也可以按列运算,取决于axis参数。 ? fillna()函数的用法也一样,对运算结果进行空值填充。

2.2K40

Pandas三百题

各列的数据类型 df1.info() 12 - 时间类型转换 将 df1 和 df2 的 日期 列转换为 pandas 支持的时间格式 df1['日期'] = pd.to_datetime(df1['...日期']) df2['时间'] = pd.to_datetime(df2['时间']) 13 - 日期筛选|区间 筛选出 df2 时间在 2021-08-03 09:35:00 与 2021-08-04...|值 将 df1 的索引设置为日期,将 df1 数据向后移动一天 df1.set_index(['日期']).shift(1) 25 - 日期重采样|日 -> 周 按周对 df1 进行重采样,保留每周最后一个数据...'日期').resample('M').last() 27 - 日期重采样|分钟 -> 日 按日对 df2 进行重采样,保留每天最后一个数据 df2.set_index('时间').resample('...D').last() 28 - 日期重采样|低频 -> 高频 将 df2 的 5分钟 数据改为 3分钟,缺失数据向前填充 df_3min = df2.set_index('时间').resample('

4.8K22
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    建议收藏:12个Pandas数据处理高频操作

    # 默认情况,统计b列各元素出现次数 df['b'].value_counts() 最好奇的bins参数,按bins分割区间,统计落在各区间内元素个数 # 按指定区间个数bin,元素起始值分割区间,..., args=(), **kwds) > 10 Pandas数据合并 进行数据合并前,首先需要确定合并的数据的表头都是一致的,然后将他们依次加入一个列表,最终使用concat函数即可进行数据合并。...# 现将表构成list,然后再作为concat的输入 df1 = df[0:1] df2 = df[2:4] df3 = df[3:5] frames = [df1, df2, df3] df4 = pd.concat...(f"df\n{df}\ndf1\n{df1}") 将原数据df的name列的第一个元素改为zs,会发现,df改动,不会影响df1。...等同df2 = df df2 = df.copy(deep=False) print(f"df\n{df}\ndf2\n{df2}") 将原数据df的name列的第一个元素改为张三,会发现,df改动,

    2.7K20

    Pandas速查手册中文版

    pd.Series(my_list):从可迭代对象my_list创建一个Series对象 df.index = pd.date_range('1900/1/30', periods=df.shape[0]):增加一个日期索引...=1,thresh=n):删除所有小于n个非空值的行 df.fillna(x):用x替换DataFrame对象中所有的空值 s.astype(float):将Series中的数据类型更改为float类型...col1进行分组,并计算col2和col3的最大值的数据透视表 df.groupby(col1).agg(np.mean):返回按列col1分组的所有列的均值 data.apply(np.mean):对...DataFrame中的每一列应用函数np.mean data.apply(np.max,axis=1):对DataFrame中的每一行应用函数np.max 数据合并 df1.append(df2):将df2...中的行添加到df1的尾部 df.concat([df1, df2],axis=1):将df2中的列添加到df1的尾部 df1.join(df2,on=col1,how='inner'):对df1的列和df2

    12.2K92

    Pandas中级教程——数据合并与连接

    本篇博客将深入介绍 Pandas 中的数据合并与连接技术,帮助你更好地处理多个数据集的情况。 1. 安装 Pandas 确保你已经安装了 Pandas。...# 按行连接 concatenated_df = pd.concat([df1, df2], axis=0) 5.2 指定连接轴 可以通过 axis 参数指定连接轴,0 表示按行连接,1 表示按列连接。...# 按列连接 concatenated_df = pd.concat([df1, df2], axis=1) 6....# 添加后缀处理重复列名 merged_df = pd.merge(df1, df2, on='common_column', suffixes=('_df1', '_df2')) 7....处理缺失值 合并数据时,可能会遇到某些行在一个数据集中存在而在另一个数据集中不存在的情况,导致合并后的结果中存在缺失值。可以使用 fillna 方法填充缺失值。

    19710

    妈妈再也不用担心我忘记pandas操作了

    df.count() # 返回每一列中的非空值的个数 df.max() # 返回每一列的最大值 df.min() # 返回每一列的最小值 df.median() # 返回每一列的中位数 df.std(...) # 返回每一列的标准差 数据合并: df1.append(df2) # 将df2中的行添加到df1的尾部 df.concat([df1, df2],axis=1) # 将df2中的列添加到df1的尾部...df1.join(df2,on=col1,how='inner') # 对df1的列和df2的列执行SQL形式的join 数据清理: df[df[col] > 0.5] # 选择col列的值大于0.5...col1进行分组,并计算col2和col3的最大值的数据透视表 df.groupby(col1).agg(np.mean) # 返回按列col1分组的所有列的均值 data.apply(np.mean).../pandas-docs/stable/index.html https://www.dataquest.io/blog/images/cheat-sheets/pandas-cheat-sheet.pdf

    2.2K31

    玩转数据处理120题|Pandas版本

    题目:将空值用上下值的平均值填充 难度:⭐⭐⭐ Python解法 # pandas里有一个插值方法,就是计算缺失值上下两数的均值 df['popularity'] = df['popularity']...,df2,df3按照行合并为新DataFrame 难度:⭐⭐ Python解法 df = pd.concat([df1,df2,df3],axis=0,ignore_index=True) 86 数据创建...题目:将df1,df2,df3按照列合并为新DataFrame 难度:⭐⭐ 期望结果 0 1 2 0 95 0 0.022492 1 22 5 -1.209494 2 3 10 0.876127 3...Python解法 df = pd.concat([df1,df2,df3],axis=1,ignore_index=True) 87 数据查看 题目:查看df所有数据的最小值、25%分位数、中位数、75%..., df2, on=['key1', 'key2']) 109 数据重塑 题目:按照多列对数据进行合并 难度:⭐⭐ 备注 只保存df1的数据 Python解法 pd.merge(df1, df2, how

    7.6K41

    一文归纳Python特征生成方法(全)

    # 一键数据分析 import pandas_profiling pandas_profiling.ProfileReport(df) 3 特征生成方法(手动) 特征生成方法可以分为两类:聚合方式...如以上述数据集,同一cust_no对应多条记录,通过对cust_no(客户编号)做分组聚合,统计C1字段个数、唯一数、平均值、中位数、标准差、总和、最大、最小值,最终得到按每个cust_no统计的C1平均值...np.min(df[['C1_fir','C1']], axis = 1) df['C1-C1_fir_abs'] = np.abs(df['C1-C1_fir']) df.head() 排名编码特征 按特征值对全体样本进行排序...常用的有计算日期间隔、周几、几点等等。...# df1为原始的特征数据 df1 = df.drop('label',axis=1) # df2为客户清单(cust_no唯一值) df2 = df[['cust_no']].drop_duplicates

    98320

    Pandas 2.2 中文官方教程和指南(四)

    我们可以将日期功能分为两部分:解析和输出。在电子表格中,日期值通常会自动解析,尽管如果需要,可以使用DATEVALUE函数。...我们可以将日期功能分为两部分:解析和输出。在电子表格中,日期值通常会自动解析,尽管如果需要,可以使用DATEVALUE函数。...在 pandas 中,您通常希望在进行计算时将日期保留为datetime对象。在电子表格中,通过日期函数和在 pandas 中通过 datetime 属性来输出日期的部分(如年份)。...我们可以将日期功能分为两部分:解析和输出。在电子表格中,日期值通常会自动解析,尽管如果需要的话可以使用 DATEVALUE 函数。...在 pandas 中,通常在进行计算时希望将日期保留为 datetime 对象。

    31710
    领券