首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Pandas进阶修炼120题,给你深度和广度船新体验

pandas as pd df = pd.read_excel('pandas120.xlsx') 22.查看df数据前5行 df.head() 23.salary数据转换为最大值与最小值平均值...时间转换为月-日 #备注,在某些版本pandas.ix方法可能失效,可使用.iloc,参考https://mp.weixin.qq.com/s/5xJ-VLaHCV9qX2AMNOLRtw for...]) 39.第8行数据添加至末尾 df.append(df.iloc[7]) 40.查看数据类型 df.dtypes 41.createTime设置为索引 df.set_index("..."new"] = df["salary"] - df[0] df 45.检查数据是否含有任何缺失值 df.isnull().values.any() 46.salary类型转换为浮点数 df[...[[1,10,15],0] 95.查找第一局部最大值位置 #备注 即比它前一个与后一个数字都大数字 tem = np.diff(np.sign(np.diff(df['col1']))) np.where

6.1K31

Pandas进阶修炼120题|第二期

大家好,Pandas进阶修炼120题系列旨在用刷题方式彻底玩转pandas各种操作,本期为第二期,我们开始吧~ 21 数据读取 题目:读取本地EXCEL数据 难度:⭐ 答案 df = pd.read_excel...答案 df.head() 23 数据计算 题目:salary数据转换为最大值与最小值平均值 难度:⭐⭐⭐⭐ 期望输出 ?...] 35 数据处理 题目:df第一与第二合并为新 难度:⭐⭐ 答案 df['test'] = df['education']+df['createTime'] 36 数据处理 题目:...df.append(df.iloc[7]) 40 数据查看 题目:查看数据类型 难度:⭐ 期望结果 createTime object education object salary int64...生成新new为salary减去之前生成随机数列 难度:⭐⭐ 答案 df["new"] = df["salary"] - df[0] 45 缺失值处理 题目:检查数据是否含有任何缺失值 难度:⭐

83800
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Pandas速查卡-Python数据科学

    df.iloc[0,:] 第一行 df.iloc[0,0] 第一第一个元素 数据清洗 df.columns = ['a','b','c'] 重命名列 pd.isnull() 检查空值,返回逻辑数组...=n) 删除所有小于n个非空值行 df.fillna(x) 用x替换所有空值 s.fillna(s.mean()) 所有空值替换为均值(均值可以用统计部分几乎任何函数替换) s.astype(float...) 数组数据类型转换为float s.replace(1,'one') 所有等于1值替换为'one' s.replace([1,3],['one','three']) 所有1替换为'one',...1) df1添加到df2末尾(行数应该相同) df1.join(df2,on=col1,how='inner') SQL类型df1与df2上连接,其中col行具有相同值。...() 查找每个最大值 df.min() 查找最小值 df.median() 查找中值 df.std() 查找每个标准差 点击“阅读原文”下载此速查卡打印版本 END.

    9.2K80

    Pandas这3个函数,没想到竟成了我数据处理主力

    应用到Series每个元素 ①性别sex转化为0和1数值,其中female对应0,male对应1。应用apply函数实现这一功能非常简单: ?...应用到DataFrame每个Series DataFrame是pandas核心数据结构,其一行和都是一个Series数据类型。...默认为axis=0。这里仍然举两个小例子: ①取所有数值数据最大值。当然,这个处理其实可以直接调用max函数,但这里为了演示apply应用,所以不妨照此尝试: ?...上述apply函数完成了对四个数值求取最大值,其中缺省axis参数为0,对应行方向处理,即对数据求最大值。...而在Pandas框架,这两种含义都有所体现:对一个Series对象每个元素实现字典映射或者函数变换,其中后者与apply应用于Series用法完全一致,而前者则仅仅是简单函数参数替换为字典变量即可

    2.4K10

    解决pandas.core.frame.DataFrame格式数据与numpy.ndarray格式数据不一致导致无法运算问题

    问题描述在pandasDataFrame格式数据可以是不同数据类型,如数值型、字符串型、日期型等。而ndarray格式数据需要每个元素都是相同类型,通常为数值型。...我们尝试A转换为ndarray进行运算,但是会出现类型不匹配错误。...= series_a + 1上述代码,我们创建了一个新变量​​series_a​​,A转换为ndarray并使用pd.Series()将其转换为pandasSeries数据格式。...通过DataFrame某一换为ndarray,并使用pd.Series()将其转换为pandasSeries数据格式,可以避免格式不一致错误。...上述代码,我们DataFrame​​Quantity​​和​​Unit Price​​换为ndarray并分别赋值给​​quantity_values​​和​​unit_price_values​​

    49120

    玩转数据处理120题|Pandas版本

    Python解法 df.head() 23 数据计算 题目:salary数据转换为最大值与最小值平均值 难度:⭐⭐⭐⭐ 期望输出 ?...时间转换为月-日 难度:⭐⭐⭐ 期望输出 ?...(r'C:\Users\chenx\Documents\Data Analysis\Pandas51-80.xls') 备注 请将答案中路径替换为自己机器存储数据绝对路径,51—80相关习题与该数据有关...([1,10,15]) # 等价于 df.iloc[[1,10,15],0] 95 数据查找 题目:查找第一局部最大值位置 难度:⭐⭐⭐⭐ 备注 即比它前一个与后一个数字都大数字 Python解法...进阶修炼120题全部内容,如果能坚持走到这里读者,我想你已经掌握了处理数据常用操作,并且在之后数据分析碰到相关问题,希望武装了Pandas你能够从容解决!

    7.5K40

    Pandas进阶修炼120题|完整版

    从读取数据到高级操作全部包含,希望可以通过刷题方式来完整学习pandas数据处理各种方法,当然如果你是高手,也欢迎尝试给出与答案不同解法。...答案 df.head() 23 数据计算 题目:salary数据转换为最大值与最小值平均值 难度:⭐⭐⭐⭐ 期望输出 ?...时间转换为月-日 难度:⭐⭐⭐ 期望输出 ?...生成新new为salary减去之前生成随机数列 难度:⭐⭐ 答案 df["new"] = df["salary"] - df[0] 45 缺失值处理 题目:检查数据是否含有任何缺失值 难度:⭐...().index[:3] 91 数据提取 题目:提取第一可以整除5数字位置 难度:⭐⭐⭐ 答案 np.argwhere(df['col1'] % 5==0) 92 数据计算 题目:计算第一数字前一个与后一个差值

    12.2K106

    Python求取Excel指定区域内数据最大值

    、第9行到第12行最大值等等,加以分别计算4行最大值;此外,如果这一数据个数不能被4整除,那么到最后还剩余几个,那就对这几个加以最大值求取即可。   ...在函数,我们首先读取文件,数据保存到df;接下来,我们从中获取指定column_name数据,并创建一个空列表max_values,用于保存每个分组最大值。...随后,使用range函数生成从0开始,步长为4索引序列,以便按4行进行分组;这里大家按照实际需求加以修改即可。...随后,我们为了最大值结果保存,因此选择result列表转换为一个新DataFrame格式数据rdf,并指定列名为Max。...如下图所示,为了方便对比,我们这里就将结果文件复制到原来文件中进行查看。可以看到,结果第1个数字,就是原始前4行最大值;结果第3个数字,则就是原始第9行到12行最大值,以此类推。

    19220

    Pandas知识点-统计运算函数

    使用DataFrame数据调用max()函数,返回结果为DataFrame最大值,即使数据是字符串或object也可以返回最大值。...在Pandas,数据获取逻辑是“先列后行”,所以max()默认返回最大值,axis参数默认为0,如果axis参数设置为1,则返回结果是一行最大值,后面介绍其他统计运算函数同理。...使用DataFrame数据调用mean()函数,返回结果为DataFrame平均值,mean()与max()和min()不同是,不能计算字符串或object平均值,所以会自动将不能计算省略...使用DataFrame数据调用median()函数,返回结果为DataFrame中位数,median()也不能计算字符串或object中位数,会自动将不能计算省略。 ?...如索引1累计求和结果为索引0、索引1数值之和,索引2累计求和结果为索引0、索引1、索引2数值之和,以此类推。 ? cummax(): 对数据累计求最大值

    2.1K20

    精心整理 | 非常全面的Pandas入门教程

    作者:石头 | 来源:机器学习那些事 pandas是基于NumPy一种数据分析工具,在机器学习任务,我们首先需要对数据进行清洗和编辑等工作,pandas库大大简化了我们工作量,熟练并掌握pandas...如何统计dataframe缺失值个数 df = pd.read_csv('https://raw.githubusercontent.com/selva86/datasets/master/Cars93...如何dataframe所有值以百分数格式表示 df = pd.DataFrame(np.random.random(4), columns=['random']) # 格式化为小数点后两位百分数...如何得到前n个最大值对应索引 df = pd.DataFrame(np.random.randint(1, 15, 15).reshape(5,-1), columns=list('abc'))...获取包含行方向上最大值个数 count_series = df.apply(np.argmax, axis=1).value_counts() print(count_series) # 输出行方向最大值个数最多索引

    10K53

    20个能够有效提高 Pandas数据分析效率常用函数,附带解释和例子

    本文介绍20个常用 Pandas 函数以及具体示例代码,助力你数据分析变得更加高效。 ? 首先,我们导入 numpy和 pandas包。...上述代码,where(df['new_col']>0,0)指定'new_col'数值大于0所有数据为被替换对象,并且被替换为0。...Melt Melt用于维数较大 dataframe转换为维数较少 dataframe。一些dataframe包含连续度量或变量。在某些情况下,这些列表示为行可能更适合我们任务。...df.year.nunique() 10 df.group.nunique() 3 我们可以直接nunique函数应用于dataframe,并查看唯一值数量: ?...Memory_usage Memory_usage()返回使用内存量(以字节为单位)。考虑下面的数据,其中有一百万行。

    5.7K30

    Pandas Cookbook》第06章 索引对齐1. 检查索引2. 求笛卡尔积3. 索引爆炸4. 用不等索引填充数值5. 从不同DataFrame追加6. 高亮最大值7. 用链式方法重现

    # 即便使用了fill_value=0,有些值也会是缺失值,这是因为一些行和组合根本不存在输入数据 In[47]: df_14.add(df_15, fill_value=0).head(10...高亮最大值 In[61]: pd.options.display.max_rows = 8 # 读取college数据集,INSTNM作为 In[62]: college = pd.read_csv...UGDS_WHITE 1.0 UGDS_BLACK 1.0 dtype: float64 # college_n.max()可以选出最大值...# 一些只有一个最大值,比如SATVRMID和SATMTMID,UGDS_WHITE却有许多最大值。有109所学校学生100%是白人。...如果再使用一次cunsum,1在中就只出现一次,而且会是最大值首次出现位置: >>> college_n.eq(college_n.max()).cumsum().cumsum() ?

    3K10

    【小白必看】Python爬虫数据处理与可视化

    datas 使用pandas.DataFrame()方法二维列表转换为DataFrame对象df,分别命名为'类型'、'书名'、'作者'、'字数'、'推荐' '推荐'数据类型转换为整型 数据统计与分组...=['类型', '书名', '作者', '字数', '推荐']) # 使用pandas二维列表datas转换为DataFrame对象df,并为命名 df['推荐'] = df['推荐'].astype...('int') # 推荐数据类型转换为整型 df.describe() # 使用describe()方法获取数据统计描述信息 df.groupby('类型').count() # 使用groupby...()方法按照类型进行分组,然后使用count()方法统计每个分组数量 font_path = 'caisemenghuanjingyu.ttf' # 替换为自定义字体文件路径 # 设置自定义字体路径...对象df,并为命名 df.to_excel('data.xlsx', index=False) # DataFrame保存为Excel文件,文件名为data.xlsx,不包含索引 结束语

    14010

    基于PandasDataFrame、Series对象apply方法

    Series对象apply方法是指对其中每个元素进行映射。 pd.Series方法变量area_split_serieslist元素转为Series。...第1个参数数据类型是函数对象,是抽出行或者列作为Series对象,可以利用Series对象方法做聚合运算。 第2 个参数为关键字参数axis,数据类型为整型,默认为0。...当axis=0时,会将DataFrame抽出来做聚合运算,当axis=1时,会将DataFrame一行抽出来做聚合运算。...抽出来一行或者数据类型为Series对象,如下图所示: ? image.png 聚合运算包括求最大值,最小值,求和,计数等。 进行最简单聚合运算:计数,如下图所示: ?...image.png 上图表示意思是在第1250个值不为空,第287个值不为空,第322个值不为空,第49个值不为空,第52个值不为空。

    3.7K50

    14个pandas神操作,手把手教你写代码

    在Python语言应用生态,数据科学领域近年来十分热门。作为数据科学中一个非常基础库,Pandas受到了广泛关注。Pandas可以现实来源多样数据进行灵活处理和分析。...注意,这里并没有修改原Excel,从我们读取数据后就已经和它没有关系了,我们处理是内存df变量。 name建立索引后,就没有从0开始数字索引了,如图4所示。 ?...df.mean() # 返回所有均值 df.mean(1) # 返回所有行均值,下同 df.corr() # 返回之间相关系数 df.count() # 返回非空值个数...df.max() # 返回最大值 df.min() # 返回最小值 df.median() # 返回中位数 df.std() # 返回标准差 df.var()...图10 利用plot.bar绘制柱状图 如果想绘制横向柱状图,可以bar更换为barh,如图11所示。 ?

    3.4K20
    领券