首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

分组后合并分组列中的字符串如何操作?

一、前言 前几天在Python最强王者交流群【IF】问了一个Pandas的问题,如图所示。...下面是他的原始数据: 序号 需求 处理人 1 优化 A 2 优化 B 3 运维 A 4 运维 C 5 需求 B 6 优化 C 7 运维 B 8 运维 C 9 需求 C 10 运维 C 11 需求 B...如果不去重,就不用unique,完美地解决粉丝的问题! 后来他自己参考月神的文章,拯救pandas计划(17)——对各分类的含重复记录的字符串列的去重拼接,也写出来了,如图所示。...这篇文章主要盘点了一个pandas的基础问题,文中针对该问题给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。...最后感谢粉丝【IF】提问,感谢【月神】、【瑜亮老师】给出的思路和代码解析,感谢【dcpeng】等人参与学习交流。

3.3K10
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    为什么 GROUP BY 之后不能直接引用原表中的列

    为什么 GROUP BY 之后不能直接引用原表(不在 GROUP BY 子句)中的列 ? 莫急,我们慢慢往下看。...、HAVING 或者 ORDER BY 子句的列,没有在GROUP BY中出现,那么这个SQL是不合法的     ANSI_QUOTES       启用 ANSI_QUOTES 后,不能用双引号来引用字符串...通过上图,相信大家也都能看到,这里不做更深入的讲解了,有兴趣的可以去查相关资料。 为什么聚合后不能再引用原表中的列   很多人都知道聚合查询的限制,但是很少有人能正确地理解为什么会有这样的约束。...SQL 的世界其实是层级分明的等级社会,将低阶概念的属性用在高阶概念上会导致秩序的混乱,这是不允许的。此时我相信大家都明白:为什么聚合后不能再引用原表中的列 。...SELECT 子句中不能直接引用原表中的列的原因;   3、一般来说,单元素集合的属性和其唯一元素的属性是一样的。

    1.7K10

    数据可视化(17)-Seaborn系列 | 回归模型图lmplot()

    ,x,y常用来指定x,y轴的分类名称 data: DataFrame,数组或数组列表 hue,row:字符串(数据字段变量名) 作用:hue对数据进行第二次分组(通过颜色区分) col:字符串...类别或者字典 作用:用于对数据不同分类进行颜色区别 col_wrap:int 作用:将多列跨行显示 height:标量 作用:指定图的大小 aspect:标量 作用:指定每一面的宽高比 markers...:标记 share{x,y} : bool, "col", or "row" 如果为true,facets将跨列共享y轴和/或跨行共享x轴。...(color_codes=True) # 构建数据 tips = sns.load_dataset("tips") """ 案例7: 通过设置col,将不同的分组分别绘制(列数为类别数) """ sns.lmplot...(多列不美观) """ sns.lmplot(x="total_bill", y="tip", col="day", hue="day", data=tips

    1.6K00

    一篇文章带你搞定Pandas绘图API

    () 绘制柱图的函数,x、y分别指定下,x、y轴的序列; tight_layout() 使得整个图紧凑显示,不然x轴的文字由于太长会被挡住; 结果如下所示: 分组柱图 首先我们还是查看数据文件:students02....xlsx 给出了2016、2017两年的学生数量,由此考虑绘制分组柱状图: import pandas as pd import matplotlib.pyplot as plt data =...16,fontweight='bold') plt.xlabel('Field',fontweight='bold') plt.ylabel('Number',fontweight='bold') # x轴刻度偏转...,x、y分别指定下,x、y轴的序列,但是由于分组柱图y轴不再是一个序列,而是由两个(或多个)序列组成的列表; plt.title() 设置标题,当然也可以在bar() 函数里面设置; plt.gca()...获得x轴的文字,下一列重新设置x轴的文字,并且把文字旋转45°,ha='right':依照右点为中心进行水平对齐; plt.gcf() 拿到绘制的图形对象,设置留白区域,left=0.2(左侧留白20%

    87110

    神奇的 SQL 之层级 → 为什么 GROUP BY 之后不能直接引用原表中的列

    为什么 GROUP BY 之后不能直接引用原表(不在 GROUP BY 子句)中的列 ? 莫急,我们慢慢往下看。...、HAVING 或者 ORDER BY 子句的列,没有在GROUP BY中出现,那么这个SQL是不合法的     ANSI_QUOTES       启用 ANSI_QUOTES 后,不能用双引号来引用字符串...通过上图,相信大家也都能看到,这里不做更深入的讲解了,有兴趣的可以去查相关资料。 为什么聚合后不能再引用原表中的列   很多人都知道聚合查询的限制,但是很少有人能正确地理解为什么会有这样的约束。...SQL 的世界其实是层级分明的等级社会,将低阶概念的属性用在高阶概念上会导致秩序的混乱,这是不允许的。此时我相信大家都明白:为什么聚合后不能再引用原表中的列 。...SELECT 子句中不能直接引用原表中的列的原因;   3、一般来说,单元素集合的属性和其唯一元素的属性是一样的。

    2.2K20

    聊一聊matplotlib绘图时自定义坐标轴标签顺序

    我们的第70篇原创 作者:Ryoko 编辑:才哥 ---- ☆ 大家好,我是才哥。 今天我们聊一个matplotlib绘图问题,就是关于如何对坐标轴标签(常见的x轴标签)按照自定义的顺序走。...原始数据预览 看到案例数据,感觉先分组求均值,如何再进行绘图就行了。但是似乎直接这样得到的可视化图不满足需求,坐标轴标签顺序与期望的不一致。怎么回事呢? 1....直接作图 很明显,这个图并非我们期望的,那么如何按照我们期望的x轴坐标轴标签顺序作图呢? 以下,我们将介绍多种方式,希望能供大家参考~ 2....= grp['学历要求'] y = grp['平均工资'] 首先制作了一个 df_map ,相当于是排序对照表,将索引作为新的顺序列。...df_map 将上面的顺序列,按照原 grp 的学历要求列,映射添加到新的 order 列 。 ? 添加排序 再按照 order 列排序即可。 ? 进行排序 4.3.

    4.9K20

    答网友问:golang中的slice作为函数参数时是值传递还是引用传递?

    今天有网友问通道和切片在赋值给另一个变量或作为函数参数传递的时候是不是引用传递?因为老师在讲解的时候说是指针传递? 先说结论:在Go语言中都是值传递,没有引用传递。...然后将b中的第一个元素更改成10。那么,a中的第一个元素也将会是10。那这是为什么呢?这个要从slice的底层数据结构来找答案。...如下: slice的底层结构其中一个实际上是有一个指针,指向了一个数组。...那么,在把a赋值给b的时候,只是把slice的结构也就是Array、Len和Cap复制给了b,但Array指向的数组还是同一个。所以,这就是为什么更改了b[0],a[0]的值也更改了的原因。...另外,在Go中还有chan类型、map类型等都是同样的原理。所以大家一定不要混淆。

    71620

    数据采集:亚马逊畅销书的数据可视化图表

    (2, 2, 1)# 绘制柱状图,显示不同类别的图书的数量# 使用df['title']列的值作为x轴的数据# 使用df['title']列的值按照类别分组,并计算每组的数量作为y轴的数据# 使用df[...'title']列的值按照类别分组,并获取每组的第一个值作为x轴的标签# 设置柱子的宽度为0.8# 设置柱子的颜色为蓝色# 设置柱子的边缘颜色为黑色plt.bar(x=df['title'], height...(2, 2, 2)# 绘制饼图,显示不同评分区间的图书的占比# 使用df['rating']列的值按照评分区间分组,并计算每组的数量作为饼图的数据# 使用df['rating']列的值按照评分区间分组,...']列的值作为y轴的数据# 使用df['title']列的值作为散点的颜色,根据类别分配不同的颜色# 使用df['title']列的值作为散点的大小,根据数量分配不同的大小# 设置标题为Books by...(2, 2, 4)# 绘制柱状图,显示不同作者的图书的平均评分# 使用df['author']列的值按照作者分组,并计算每组的评分均值作为y轴的数据# 使用df['author']列的值按照作者分组,并获取每组的第一个值作为

    27520

    盘点8个数据分析相关的Python库(实例+代码)

    1. ndarray 多维数组对象 NumPy库中的ndarray是一个多维数组对象,由两部分组成:实际的数据值和描述这些值的元数据。...只看最外面一层,它相当于一个一维数组,该一维数组中的每个元素也是一维数组。那么,这个一维数组即二维数组的轴。...loat)) # 使用 NumPy 的 linspace() 函数在 -10 和 10 之间产生 30 个均匀分布的值,作为函数 x 轴的取值 x = np.linspace(-10, 10 , 30)..., 0.1) y_sin = np.sin(x) y_cos = np.cos(x) # subplot的3个参数,2、1、1 ,表示绘制2行1列图像中的第一个子图 plt.subplot(2, 1,...1)# 绘制第一个子图 # 绘制第一个图像 plt.plot(x, y_sin) plt.title('Sin') plt.subplot(2, 1, 2)# 绘制2行1 列图像中的第二个子图 plt.plot

    2.6K20

    OpenCV 各数据类型中的行与列,宽与高,x与y

    在IplImage类型中图片的尺寸用width和 height来定义,在Mat类型中换成了cols与rows,但即便是这样,在C++风格的数据类型中还是会出现width和 height的定义,比如Rect...总的来说就是: Mat类的rows(行)对应IplImage结构体的heigh(高),行与高对应point.y Mat类的cols(列)对应IplImage结构体的width(宽),列与宽对应point.x...这个不难理解,opencv的坐标系原点在左上角,但是还是水平轴是x,垂直轴是y 1.新建一个mat类型 Mat MoveImage(SrcImage.rows,SrcImage.cols,CV_...;j++) { MoveImage.at(i,j) = (int)SrcImage.at(i,j); } } i = 行 = y j = 列 = x...它由两个参数定义: 矩形左上角坐标: (x,y) 矩形的宽和高: width, height Rect可以用来定义图像的ROI区域。

    1.2K10

    【转】MySQL InnoDB:主键始终作为最右侧的列包含在二级索引中的几种情况

    主键始终包含在最右侧列的二级索引中当我们定义二级索引时,二级索引将主键作为索引最右侧的列。它是默默添加的,这意味着它不可见,但用于指向聚集索引中的记录。...:ALTER TABLE t1 ADD INDEX f_idx(f);然后,该键将包含主键作为辅助索引上最右侧的列:橙色填充的条目是隐藏条目。...当我们在二级索引中包含主键或主键的一部分时,只有主键索引中最终缺失的列才会作为最右侧的隐藏条目添加到二级索引中。...bbbbbbbbbb | 1 | abc || ccccccccc | dddddddddd | 2 | def |+------------+------------+---+-----+我们可以看到a二级索引中只使用了该列的...如果我们检查 InnoDB 页面,我们可以注意到,事实上,完整的列也将被添加为二级索引最右侧的隐藏部分:所以InnoDB需要有完整的PK,可见或隐藏在二级索引中。这是不常为人所知的事情。

    15510

    python---数据可视化篇

    像下面的这个情况之所以会出现,原因就是我们对于这个字体的设置没有成功,我们需要根据自己的操作系统去设置对应的字体; 解决中文不显示的问题,我们可以在导入matplotlib.pyplot后,在代码中对plt.rcParams...x有关系,这样的话,随着这个x的变化,这个两个y都可以有自己的变化,方便我们查看这个走势; # 导入matplotlib.pyplot,并使用"plt"作为该模块的简写 import matplotlib.pyplot...; suplot函数用来绘制子图,前面的两个参数表示的是这个子图的行数和列数,第三个参数表示的就是这个子图位于那一个顺序上面; xticks(rotation=90)这个是为了旋转我们的x轴说明文字的位置...,不让我们的下面的子图遮挡x的说明; 由于pandas模块不能像matplotlib.pyplot一样默认将图像绘制到当前的子图坐标轴上,所以需要传入ax=plt.gca(),来确保图像绘制在当前子图的坐标轴中...4子图 plt.subplot(2,2,4) # 使用plot.bar()函数,stacked=True和ax=plt.gca() # 根据percentData中的数据 # 以"month"为x轴,绘制对比

    14910
    领券