通过 xlim 和 ylim 来限定坐标轴的范围,只能确定一个数值区间 通过 xlabel 和 ylabel 来设置坐标轴的名称 通过 xticks 和 yticks 来设置坐标轴的刻度 plt.plot...使用子图 有时候我们需要将多张子图展示在一起,可以使用 ==subplot() ==实现。即在调用 plot() 函数之前需要先调用 subplot() 函数。...该函数的第一个参数代表子图的总行数,第二个参数代表子图的 总列数,第三个参数代表活跃区域 ax1 = plt.subplot(2, 2, 1) # (行,列,活跃区) plt.plot(x, np.sin...有时候我们需要不同大小的子图。比如将上面第一 张子图完全放置在第一行,其他的子图都放在第二行。...pd.date_range('2023/8/4', periods=10), columns=list('ABCD')) df.plot() 执行上面示例代码,得到以下结果 - 如果索引由日期组成
Workbook() ws = wb.active #将 DataFrame 格式数据转化为 openpyxl 格式 for r in dataframe_to_rows(df_view,index...df_province = pd.DataFrame(df[df['创建日期'] == '2021-04-11'].groupby('省份 ')['order_id'].count()) df_province...(图5) 在得到各省份当日创建订单量的绝对数值之后,同样对其进行格式设置,具体设置代码如下。...in dataframe_to_rows(df_province,index = False,header = True): ws.append(r) #对第 1 行至第 11 行的单元格进行设置...in dataframe_to_rows(df_view,index = True,header = True): ws.append(r1) for r2 in dataframe_to_rows
在 Pandas 中,索引可以设置为一个(或多个)唯一值,这就像在工作表中有一列用作行标识符一样。与大多数电子表格不同,这些索引值实际上可用于引用行。...日期功能 本节将提到“日期”,但时间戳的处理方式类似。 我们可以将日期功能分为两部分:解析和输出。在Excel电子表格中,日期值通常会自动解析,但如果您需要,还有一个 DATEVALUE 函数。...在 Pandas 中,您需要在从 CSV 读取时或在 DataFrame 中读取一次时,将纯文本显式转换为日期时间对象。 解析后,Excel电子表格以默认格式显示日期,但格式可以更改。...在 Pandas 中,您通常希望在使用日期进行计算时将日期保留为日期时间对象。输出部分日期(例如年份)是通过电子表格中的日期函数和 Pandas 中的日期时间属性完成的。...按位置提取子串 电子表格有一个 MID 公式,用于从给定位置提取子字符串。获取第一个字符: =MID(A2,1,1) 使用 Pandas,您可以使用 [] 表示法按位置位置从字符串中提取子字符串。
当日各省份创建订单量情况: 我们同样先利用Pandas库处理得到当日各省份创建订单量情况,具体实现代码如下: df_province = pd.DataFrame(df[df['创建日期'] == '2021...,同样对其进行格式设置,具体设置代码如下: from openpyxl import Workbook from openpyxl.utils.dataframe import dataframe_to_rows...in dataframe_to_rows(df_province,index = False,header = True): ws.append(r) #对第1行至第11行的单元格进行设置 for...') plt.xlabel('日期') plt.ylabel('订单量') #将图表保存到本地 plt.savefig(r'D:\Data-Science\share\excel-python报表自动化...(df_view,index = True,header = True): ws.append(r1) for r2 in dataframe_to_rows(df_province,index
spx 是个 DataFrame,将它的值一个个画出折线图只需用 plt.plot() 函数,展示在屏幕需用 plt.show()。...2.5 设置边界 ? ? 横轴怎么是数字,不应该是日期么?另外这条线快碰到天花板了。 这个需求合理,设置下横轴和纵轴的边界就可以了。 ? ?...第 3 行的 x 是日期 (回顾 spx 是一个 DataFrame,行标签是日期)。...上图横轴的刻度个数 (老板说日期隔得有点开) 和标签显示 (老板说只有年月) 都是默认设置。...定义 subplot(2,1,1) 和 subplot(2,1,2) 就能实现再两幅子图上画图。 在每幅子图上画图以及各种设置前面都讲的很清楚了。
title 设置子图的标题。 xlim、ylim 分别设置X、Y轴的显示范围。 legend 显示图示,即图中表示每条曲线的标签(label)和样式的矩形区域。...一个绘图对象(figure)可以包含多个轴(axis),在Matplotlib中用轴表示一个绘图区域,可以将其理解为子图。上面的第一个例子中,绘图对象只包括一个轴,因此只显示了一个轴(子图Axes)。...再举一个创建子图的例子: plt.figure(1) # 创建图表1 plt.figure(2) # 创建图表2 ax1 = plt.subplot(211) # 在图表2中创建子图1 ax2 = plt.subplot...在循环中: 先调用figure(1)让图表1成为当前图表,并在其中绘图。 然后调用sca(ax1)和sca(ax2)分别让子图ax1和ax2成为当前子图,并在其中绘图。...可以看到: 对于DataFrame,柱形图会将每一行的值分为一组; DataFrame的各列名称都被用作了图例的标题; 设置stacked=True即可为DataFrame生成堆积柱形图,这样每行的值就会被堆积在一起
2.5 设置边界 ? ? 横轴怎么是数字,不应该是日期么?另外这条线快碰到天花板了。 这个需求合理,设置下横轴和纵轴的边界就可以了。 ? ?...第 3 行的 x 是日期 (回顾 spx 是一个 DataFrame,行标签是日期)。...上图横轴的刻度个数 (老板说日期隔得有点开) 和标签显示 (老板说只有年月) 都是默认设置。...用 ax1 和 ax2 就能实现在两个坐标系上画图,代码核心部分是第 19 行的 ax2 = ax1.twinx() 在每个坐标系下画图以及各种设置前面都讲的很清楚了。 两幅子图 ? ?...定义 subplot(2,1,1) 和 subplot(2,1,2) 就能实现再两幅子图上画图。 在每幅子图上画图以及各种设置前面都讲的很清楚了。
px.scatter(df, x='Date', y='Value', title='Dynamic Scatter Plot', animation_frame='Date', # 按日期动画化...margin=dict(l=50, r=50, t=50, b=50), # 边距设置 plot_bgcolor='rgba(0,0,0,0)', #...使用Plotly Express进行子图布局Plotly Express还支持创建多个子图并将它们组合成一个图形布局。这对于比较不同数据集或者在同一图表中显示多个相关数据非常有用。...(data1)df2 = pd.DataFrame(data2)# 使用Plotly Express创建子图布局fig = px.subplots( px.scatter(df1, x='X',...此外,我们还介绍了如何使用Plotly Express创建动态图表和子图布局,以便更好地探索和展示数据。
每个标签会显示在相应部分的旁边,标识出该部分代表的数据类别。 autopct=‘%1.1f%%’:这是用来设置饼图中每个部分的自动百分比显示的。...第四部分:数据处理与可视化 4.1 pandas 与 matplotlib 的结合 在实际项目中,我们经常需要处理数据框 (DataFrame),例如从 Excel、CSV 等文件读取数据。...data['日期'] 和 data['销售额']:从 DataFrame 中选择特定的列进行绘图。 plt.plot():基于数据创建折线图。...4.3 创建子图布局 当我们有多组数据想要展示在同一个窗口时,可以使用子图布局。在 matplotlib 中,子图功能允许我们将同一个图表窗口划分为多个区域,每个区域展示不同的数据。...(2, 1) # 2行1列的子图布局 # 绘制第一个子图 ax[0].plot(日期, 产品A, color='blue') ax[0].set_title('产品A的销售额') # 绘制第二个子图
bargap:浮点数格式,值在0和 1 之间,用于设置柱状的间隔,仅当 kind = bar 或 historgram 才适用。...bargroupgap:浮点数格式,值在 0和 1 之间,用于设置柱状分组的间隔,仅当 kind = bar 或 historgram 才适用。...secondary_y:字符串格式,数据帧中用于第二个 y 轴变量的列标签 secondary_y_title:字符串格式,用于设置第二个 y 轴标题 subplots:布尔格式,如果 True 则画子图...close'] df.index = pd.to_datetime(df.index) df.head(3).append(df.tail(3)) 接下来画图,代码简单到已经不需要额外文字解释了,对比着参数设置一下子就能找出图中相对应特征...分四步: 将具体的子图一个个按顺序放入 cf.figures() 里 创建布局,用 cf.tools.get_base_layout() 设定每个子图占布局的位置,用 cf.subplots() 并设置
一般,最常用的交易数据存储格式是csv,但是csv有一个很大的缺点,就是无论如何,存储起来都是一个文本的格式,例如日期‘2018-01-01’,在csv里面是字符串格式存储,每次read_csv的时候,...很显然,groupby把dataframe按照日期分成好多小的dataframe。...groupby apply的彩蛋 groupby后面apply的函数运行过程中,第一个被groupby拆分的子dataframe会被apply后面的函数运行两次。...大家如果看仔细的话,会发现,第一个子dataframe和第二个dataframe其实是一样的。...pandas官方说,之所以这样是第一个子dataframe传入的目的是为了寻找一个能够优化运行速度的方法,提高后面的运行效率。
在处理时间序列数据时,x轴通常包含占用大量空间的日期,所以可以减少轴上的刻度数来提高显示效果。 让我们先做一个不限制x轴刻度数的例子。...下面我们添加设置只显示部分的刻度,这样可以完整显示。...我们的DataFrame中的销售数量和价格列显示在同一线图上,只有一个y轴。 可以看到价格和销售数量的取值范围差距很大我们几乎看不到销售的变化,这时可以使用辅助轴来指定另外一条线的取值范围。...共享x轴的子图坐标对齐 我们可以在一个Figure对象上创建多个子图。Matplotlib允许使用subplot函数创建子图格。例如下面的代码行创建了一个包含4个子图的2x2网格图。...X轴坐标(日期)都已经对齐了,这对于分析时间序列时非常有用的,例如想对比2个产品或者2个不同的门店在同一时期的销售情况,通过对齐日期可以给出非常好的直观判断。
从上图可以看到,第一列(紫色框内)的日期有很多缺失值,例如一下子就从第001天跳到了005天,然后又直接到了042天。...接下来,我们使用pd.to_datetime方法将df中的时间列转换为日期时间格式,并使用set_index方法将时间列设置为DataFrame的索引。 ...随后,计算需要填补的日期范围——我们将字符串'2021001'转换为日期时间格式并作为结束日期,将字符串'2021365'转换为日期时间格式并作为结束日期,使用pd.date_range方法生成完整的日期范围...接下来,使用reindex方法对DataFrame进行重新索引,以包含完整的日期范围,并使用0填充缺失值。...随后,即可将修改后的DataFrame保存到输出文件中,使用to_csv方法,并设置index=False以避免保存索引列。 运行上述代码,即可得到如下图所示的结果文件。
本文来自 @范洺源 投稿,在其基础上做了点修改 ---- 最近在学爬虫和数据分析,看到天气网上有国内城市一年的天气历史数据,想以此为数据源练习一下,于是就有了这个项目。...由于需要进行一定的数据分析,所以这里没有将数据保存到文件,而是直接使用 pandas 的 dataframe 进行储存。...北京平均温度在0度和20多度的日子是最多的。...按月查看温度走势 result.groupby(result['日期'].apply(lambda x:x.month)).mean().plot(kind='line') ?...我们编程教室会持续向所有人开放,如果有投稿或参与志愿者的意向,欢迎随时在公众号里给我们留言。 ----
16" ... # $ test1 : chr [1:135] "27500本科" "30000本科" "27500不限" "16500本科" ... 41 数据处理 题目:将createTime列设置为索引...Python解法 df[df['日期'].isnull()] R解法 df[is.na(df$日期),] 55 缺失值处理 题目:输出每列缺失值具体行数 难度:⭐⭐⭐ 期望结果 列名:"代码", 第[327...61 数据创建 题目:以data的列名创建一个dataframe 难度:⭐⭐ Python解法 temp = pd.DataFrame(columns = df.columns.to_list()) R...df %>% summarise(pct_change = (`收盘价(元)` - lag(`收盘价(元)`))/lag(`收盘价(元)`)) 69 数据处理 题目:设置日期为索引 难度:⭐ Python...解法 df.set_index('日期') R解法 df %>% column_to_rownames(var='日期') 70 指标计算 题目:以5个数据作为一个数据滑动窗口,在这个5个数据上取均值
领取专属 10元无门槛券
手把手带您无忧上云