如何使用groupby可视化数据

使用groupby可视化数据的步骤如下：

首先，了解groupby的概念：groupby是一种数据处理操作，它将数据按照指定的列进行分组，并对每个分组进行聚合操作。
在前端开发中，可以使用JavaScript的数据处理库如D3.js、Chart.js等来实现groupby可视化数据。这些库提供了丰富的图表类型和交互功能，可以根据分组后的数据生成各种可视化图表，如柱状图、折线图、饼图等。
在后端开发中，可以使用Python的数据处理库如Pandas、Matplotlib等来实现groupby可视化数据。Pandas提供了方便的数据分组和聚合功能，可以将数据按照指定的列进行分组，并计算每个分组的统计指标。Matplotlib则可以用来生成各种图表，如条形图、折线图、散点图等。
在软件测试中，可以使用groupby来对测试数据进行分组，比较不同分组的测试结果，以评估软件的性能和稳定性。例如，可以将测试数据按照不同的操作类型进行分组，并计算每个分组的平均响应时间、错误率等指标，然后使用可视化工具展示这些指标的变化趋势。
在数据库中，可以使用groupby来对查询结果进行分组和聚合操作。例如，可以将数据库中的销售数据按照不同的地区进行分组，并计算每个地区的销售总额、平均销售额等指标，然后使用可视化工具展示这些指标的差异。
在服务器运维中，可以使用groupby来对服务器日志进行分组和分析。例如，可以将服务器日志按照不同的错误类型进行分组，并计算每个分组的出现次数、占比等指标，然后使用可视化工具展示这些指标的变化趋势。
在云原生应用开发中，可以使用groupby来对容器或微服务的日志进行分组和分析。例如，可以将日志按照不同的服务或容器进行分组，并计算每个分组的请求量、响应时间等指标，然后使用可视化工具展示这些指标的变化趋势。
在网络通信中，可以使用groupby来对网络流量数据进行分组和分析。例如，可以将网络流量按照不同的协议或源IP地址进行分组，并计算每个分组的流量大小、流量占比等指标，然后使用可视化工具展示这些指标的变化趋势。
在网络安全中，可以使用groupby来对安全事件数据进行分组和分析。例如，可以将安全事件按照不同的攻击类型或受攻击目标进行分组，并计算每个分组的事件数量、事件占比等指标，然后使用可视化工具展示这些指标的变化趋势。
在音视频处理中，可以使用groupby来对音视频数据进行分组和聚合操作。例如，可以将音频数据按照不同的频率进行分组，并计算每个分组的平均音量、音频长度等指标，然后使用可视化工具展示这些指标的变化趋势。
在多媒体处理中，可以使用groupby来对多媒体数据进行分组和聚合操作。例如，可以将图片数据按照不同的颜色进行分组，并计算每个分组的像素数量、颜色占比等指标，然后使用可视化工具展示这些指标的差异。
在人工智能中，可以使用groupby来对训练数据进行分组和聚合操作。例如，可以将图像数据按照不同的类别进行分组，并计算每个分组的样本数量、准确率等指标，然后使用可视化工具展示这些指标的变化趋势。
在物联网中，可以使用groupby来对传感器数据进行分组和聚合操作。例如，可以将温度传感器数据按照不同的地点进行分组，并计算每个分组的平均温度、温度波动等指标，然后使用可视化工具展示这些指标的变化趋势。
在移动开发中，可以使用groupby来对移动应用的用户数据进行分组和聚合操作。例如，可以将用户数据按照不同的地区或设备类型进行分组，并计算每个分组的用户数量、活跃度等指标，然后使用可视化工具展示这些指标的差异。
在存储领域，可以使用groupby来对存储数据进行分组和聚合操作。例如，可以将文件数据按照不同的文件类型进行分组，并计算每个分组的文件数量、文件大小等指标，然后使用可视化工具展示这些指标的变化趋势。
在区块链领域，可以使用groupby来对交易数据进行分组和聚合操作。例如，可以将交易数据按照不同的交易类型进行分组，并计算每个分组的交易数量、交易金额等指标，然后使用可视化工具展示这些指标的差异。
在元宇宙领域，可以使用groupby来对虚拟世界中的数据进行分组和聚合操作。例如，可以将虚拟世界中的用户数据按照不同的角色或地区进行分组，并计算每个分组的用户数量、活跃度等指标，然后使用可视化工具展示这些指标的变化趋势。

综上所述，使用groupby可视化数据可以帮助我们更好地理解和分析数据，从而做出更准确的决策。在实际应用中，可以根据具体的需求选择适合的可视化工具和技术来实现groupby可视化数据。

页面内容是否对你有帮助？

有帮助

没帮助

如何制作标有标签的线条图？

假设我想跟踪电视节目的收视率。因此，有三列数据季节数字，年份，和评级。我想要的年份和评级的轴和季节编号作为标签上的点数。考虑到可视化工具只接受X和Y轴的值，如何实现这一点？

浏览 0提问于2019-06-05得票数 1

2回答

我下面的代码很好。但是..。我认为有一种更有效的编码方法。但我搞不懂。我认为reset_index()工作得很好，但在这种情况下就不行了。所以，所有的建议都是欢迎的。提前感谢！我有一个很大的数据(医院数据)。所有数据均来自2017年、2018年和2019年。专栏: spoedelectief可以有两个值:一个用于紧急情况，另一个用于非紧急病人。在荷兰，紧急情况被称为Spoed。所以，紧急是S，而非紧急是E。从dataframe我想要(可视化的数量的紧急和非紧急情况每年)一个新的数据。但我被困住了。一些代码； test = df_new.groupby(df_new['operati

浏览 3提问于2020-12-07得票数 1

回答已采纳

2回答

可视化特定时间段内的人数数据

、、

我有一个数据可视化的问题，我想得到一些意见。我目前正在使用python pandas清理数据集，然后将其上传到SISENSE中以供使用。我尝试做的是可视化活动作业，根据特定任务的开始日期和结束日期按周/月进行分组。例如，我有一组作业，它们的开始日期如下，在数据帧中以行的形式组织：作业ID开始日期结束日期工作1 5/25/2020 6/7/2020 工作2 2020年5月25日31日在2020年5月25日的那一周，我有两个活跃的工作，而在2020年6月1日的一周，我有1个活跃的工作。可视化应该看起来像一个条形图，其中x轴是周/时间段，y轴是活动作业的计数。我如何才能最好地将其组织到一个数

浏览 10提问于2020-05-28得票数 0

2回答

可视化来自一列的数据

、、、、

假设我有一个数据框架，其中有一个列作为性别，其中包含的值如下- male female female empty male female 如何使用matplotlib以条形图或饼图的形式可视化这些数据，以显示男性和女性的数量/百分比？

浏览 4提问于2017-04-21得票数 1

回答已采纳

1回答

将一个分类变量的计数与另一个变量的色调可视化

、、

我有一个数据集，其中大部分是分类列，我想将它们相互可视化。我没有任何计数，所以我尝试在value_counts中使用seabon，尽管它不能完成这项工作。数据集示例如下： Gender category visitor m G Y f G Y f S Y m S N m G N m G Y f S

浏览 9提问于2019-05-17得票数 0

1回答

如何在Python中可视化聚合VADER情绪分值随时间的变化？

、、、、

我有一个熊猫数据帧，其中包含2019年7月24日至2019年10月19日期间的推文。我已经对每条推文应用了维德情绪分析方法，并在新的专栏中添加了情绪分数。现在，我希望将其可视化在某种折线图中，以便分析在这三个月期间，每天的平均情绪得分是如何变化的。因此，我需要x轴上的日期，以及y轴上的平均负分数、正分数和复合分数(三条不同的线)。我有一个想法，我需要以某种方式对数据进行分组或重新采样，以便显示每天的聚合情感值，但由于我的Python技能仍然有限，我还没有成功地找到一个有效的解决方案。如果有人对我如何继续下去有一个想法，那将是非常感谢的！我附上了一张我的日期框的图片，以及我脑海中的情节类型

浏览 6提问于2020-05-26得票数 0

1回答

当DataFrame拥有mutliIndex时，如何将其可视化？

我正在做从kaggle下载的“电子游戏销售”项目，数据如下： 📷 我想知道在每个平台上，哪个是最受欢迎的三种类型？但是我不知道如何把它可视化，我用熊猫过滤数据，下面是代码： 📷 那么，我怎样才能使用熊猫(或海运等)？完成这个目标？我很感激你的回答。

浏览 0提问于2020-07-15得票数 1

回答已采纳

2回答

(Py)火花框架中数据的可视化

、、、

关于星火DataFrames方法可视化的问题。至于现在(我使用的是2.0.0)，星火DataFrames还没有任何可视化功能。通常，解决方案是将示例的DataFrame收集到驱动程序中，将其加载到Pandas DataFrame中，并使用其可视化功能。我的问题是:如何知道最大限度地利用驱动程序内存的最佳采样大小是什么，以便可视化数据？或者，解决这个问题的最佳做法是什么？谢谢!

浏览 5提问于2017-01-31得票数 5

2回答

如何从具有多行的2个不同的数据集创建可视化？

、、

我正在尝试将GPU的价格与加密货币的价格进行比较。我已经能够创建两个单独的可视化，显示GPU的平均价格和加密货币的平均价格按年，但似乎无法将它们结合起来。 ... plt.plot(GPUDATA.groupby(GPUDATA['Date'].dt.strftime('%Y')['Price_USD'].mean()) ... 它为"GPU价格“生成了这个图像： plt.plot(BITCOINDATA.groupby(BITCOINDATA['Date'].dt.strftime('%Y'))[

浏览 1提问于2019-04-07得票数 0

1回答

如何比较数据帧中的列

、、

我试图在一个数据框架中可视化地比较两列，它要么用“频率”构成一个奇怪的表，而不是其中的一个列我尝试了这些选择： ct1=pd.crosstab(df['releaseyear'],df['score'],normalize=True) ct1.plot() df.plot( x='releaseyear', y='score', kind='hist') 还有一个散点图，它得到了x和y，但是我不知道它是如何规范化的，所以它只显示了每年的平均值，而不是所有的数据。 plt.scatter(df['rele

浏览 4提问于2022-01-24得票数 0

回答已采纳

2回答

表中前5项

、

给定以下数据：我想从表格中获得前5个结果。我尝试了以下公式：度量：Violation Ranking = RANKX(ALL(Violation_Data), COUNTA(Violation_Data[Violation])) 专栏：Top Violations = IF([Violation Ranking] > 5, "Others", Violation_Data[Violation]) 但是我仍然可以从得到所有的结果。我尝试使用可视化过滤器(仅显示违规排名<= 5)，但我仍然得到相同的结果(每个违规的违规排名为1(至少可以说这很奇怪)，这就是

浏览 1提问于2017-03-24得票数 0

1回答

大熊猫的多层次聚类

、、

我想创建一个多层次的表，虽然不是嵌套依赖。我希望我的截图澄清了我的意思： print (df) Country Type data 0 Ger VW oo 1 Ita Skoda kk 2 Ger Skoda oo 3 Ita VW ik 上面是我的数据的表示，下面是我希望的结果，achieve.The数字是发生次数的总和。我的下一步是将其可视化。数据帧称为cleaned_df 非常感谢你的帮助！

浏览 19提问于2019-09-05得票数 1

回答已采纳

1回答

Pandas 6个月重采样-用户年龄/性别/播放数据

、、、、

我正在试图优化一个可视化，它的方式是塞满了下面的年度数据。以下是我的usa_signup_age数据帧中的一段内容： gender age signup 2002-10-29 m 31.0 2002-10-29 m 23.0 2002-10-29 m 23.0 2002-11-22 m 29.0 2002-11-28 m 25.0 2002-12-02 m 31.0 2003-02-06 m 29.0 2003-02-06 m 25.0 2003-02-06 m 25.0 2003-02-06 m 4

浏览 0提问于2018-02-22得票数 0

1回答

Pandas:从排序的数据帧中提取数据

、

假设我有一个包含两列的数据帧:第一列是字符串形式的'Name‘，第二列是int类型的'score’。有许多重复的名称，它们的排序方式是所有的“name1”将在连续的行中，后跟“name2”，依此类推。每一行可以包含不同的score.The数目重复名称对于每个唯一的字符串也可能不同。我希望从这个数据帧中提取数据，并将其放入一个新的数据帧中，以便在name列中没有重复的名称，并且每个名称的相应分数是其在原始数据帧中的分数的平均值。为了更好的可视化，我提供了一张图片： ?

浏览 11提问于2021-04-03得票数 0

回答已采纳

2回答

动态GROUPBY在DAX，PowerBI中的应用

、

我对PowerBI和DAX语言很陌生。考虑到下表All interactions (它是用户与系统交互的集合)：我想创建以下可视化： (在X轴上是总交互数，在具有该交互数的系统中用户的Y轴百分比) 这可以通过创建一个动态表来完成，如： TableFoo = GROUPBY ( 'All interactions', 'All interactions'[user_name], "total_interactions", COUNTX ( CURRENTGROUP (), 'All interaction

浏览 4提问于2019-10-23得票数 1

回答已采纳

2回答

每张发票使用海运和熊猫购买的物品数量

、、

我使用的是，我想要绘制每个发票号码的项目数量分布。类型的InvoiceNo :非空对象类型数量:非空int64 怎么做？而且，我不知道如何过滤，使用熊猫操作，以获得没有可视化。例如，如果我想知道每张发票的数量，我可以这样做： retail_uk.groupby('InvoiceNo').sum().sort_values(by='Quantity', ascending=False)['Quantity'] 我需要两个问题的答案：如何用Seaborn (更重要的是因为它可以让我更好地了解发行版)来绘制它(更重要的是，它允许我更

浏览 5提问于2017-12-08得票数 0

回答已采纳

1回答

如何显示seaborn生成的错误条值？

、、、、

我正在尝试使用seaborns来可视化一些数据。我使用的是被设置为条形图的猫图。我把误差条显示为标准差。我想知道它在可视化中使用的平均值和标准差是什么值，但是我不知道如何从图中检索该信息。我该如何着手获取这些信息呢？ bar_graph = seaborn.catplot(x="x", y="y", hue="z", data=data, ci="sd", capsize=0.1, kind="bar")

浏览 30提问于2019-06-14得票数 0

回答已采纳

1回答

在Python中绘制多分类数据

、、、

Month,Cluster,Count 7,Linux,42 7,Linux,56 7,Pct,6 7,Pct(C),11 7,Memory,28 10,Latency,73 10,Linux,47 10,Pct,21 10,Pct(C),18 10,Swap,41 10,Protection ,509 我需要比较月份7,10和每个月的曲线图集群。如何在python中可视化这些数据。我需要区分这两个月的群集数量

浏览 31提问于2021-11-16得票数 0

1回答

Pandas中分组数据的箱形图

、、

我正在尝试绘制分组数据集的箱线图。想象一下我的数据集是这样的 Gender | Age ------ | ------ Male | 20 ------ | ------ Female | 40 ------ | ------ Female | 45 ------ | ------ Unknown| 5 ------ | ------ Male | 80 ------ | ------ Female | 30 ------ | ------ Unknown| 50 ------ | ------ Male | 12 现在我想要做的是绘制一个盒子图，在相同的曲线图中显示所有三个性别

浏览 2提问于2016-09-20得票数 1

1回答

Pandas dataframe信息组织的最有效方法

、

我想要存储在熊猫数据上的数据结构可以表示如下： F1 F2 F3 . . . . a b c t1 t2 . . t18000 x1 x2 . . x18000 y z 当我想要可视化行时，我不想看到18000 t或x变量，只是为了了解dataframe包含了哪些信息。相反，我想做这样的事情: a，b，c，t，x，y，z 我对Pandas模块并不十分熟悉，所以我的问题是，我应该如何存储这些信息才能到达前面提到的行名呢？更具体而言：我应该将t和x值作为数组存储在一个单元格中吗？F1 F2 ..。t1 t2 ..。t18000 x x1 x2 .x18000

浏览 1提问于2014-12-09得票数 0

回答已采纳

1回答

VEGA Sunburst使用基于表的原始数据

我正在开发一个Sunburst，它最终将接收输入数据，而不是配置的父-子结构，而是基于列的数据，因此我使用了一个嵌套转换，而不是一个分层，如给定的示例所示：它的问题是，它生成内部节点，即使某些字段是空的，只要我的数据对象获得叶节点可用的值。如何转换数据以获得可视化，如下面的示例所示

浏览 4提问于2022-02-25得票数 1

回答已采纳

1回答

海图绘制频率

、

我正在查看一个SNL数据集，我想使用海运来查看几个不同的东西。我用这个来学习更多关于jupyter可视化的知识(也就是我是初学者)。数据集如下所示：援助:演员能力:他们的作用是什么？战车:独特的人物身份 impid:唯一的模仿id 角色:他们扮演的角色的名称工贸署:草图编号他们只是画外音吗？ epid:第一集希德:第一季一些问题:谁是前20名演员出现在SNL？最常用的角色是什么？印象最频繁？哪些角色由多个演员扮演？我试过了，但人太多了，我想把它限制在20个人左右。或者如果你有其他视觉化的建议去尝试，我会全神贯注的。 plt.style.use('seaborn-w

浏览 0提问于2019-04-12得票数 0

回答已采纳

1回答

使用python计数来自2列的数据

、

在我的forum.csv文件中，有student_id和course_id列。这些列的数据如下所示： student_id,course_id 886652,SIM4207 886652,SIM4207 4484596,SSE3306 4484596,SSE3306 5843448,SSE3150 886652,SIM4207 我想要做的是，我想要计算这两列的出现次数，例如 student_id,course_id, occurrences 886652,SIM4207- 1 886652,SIM4207- 2 4484596,SSE3306- 1 4484596,SSE3306- 2 58

浏览 21提问于2020-10-22得票数 2

回答已采纳

1回答

可视化pandas分组数据

、、

您好，我正在处理以下数据集 df = pd.read_csv('https://github.com/datameet/india-election-data/blob/master/parliament-elections/parliament.csv') df.groupby(['YEAR','PARTY'])['PC'].nunique() 如何创建以年份为x轴、pc计数为y轴、堆叠柱标签为参与方名称的堆叠条形图。基本上我想显示前5党每年的价值，桶所有其他党(不包括IND)作为‘其他’ 我想要可视化像下面这样的

浏览 11提问于2017-07-10得票数 2

1回答

Python Pandas -到目前为止在每行的列中找到的字符串计数

、

我正在对过去的非霍奇金淋巴瘤赛季进行一些分析和可视化，在我的DataFrame中创建一些额外的数据/特征时遇到了困难。这是数据帧的简化版本，其中每行表示一个游戏。 game_id h_abbr a_abbr 0001 WSH TOR 0002 ANA TOR 0003 TOR MIN 我如何计算到目前为止每支球队打了多少场比赛(包括有问题的比赛)，这样新的专栏就会看起来像这样？ game_id h_abbr a_abbr ht_game_no at_game_no 0001 WSH TOR 1 1 0002

浏览 24提问于2020-01-11得票数 1

回答已采纳

1回答

如何在GroupBy语句中使用ServiceStack OrmLite

我正在对数据可视化进行一些查询，并依赖于GroupBy、Avg、Sum和类似的函数从DB获得一个良好的数据集。我想使用类似于GroupBy和ServiceStack OrmLite的东西。在上，我看到以下查询。有没有更简单或更好的方法来做这件事？例如，我有一个'location‘列，并希望找到条目的前5个位置，并列出这些位置的发生次数。我只有一张桌子，所以不需要加入。 var rows = db.SqlList<ShipperTypeCount>( "SELECT {0}, COUNT(*) AS Total FROM Sh

浏览 1提问于2015-06-11得票数 3

回答已采纳

1回答

列中字符串值的PySpark数据可视化

、、、、

我有一个表，该表中的信息如表中所示：我需要通过在给定的一年中每月完成的研究的数量来进行数据可视化。我认为(摘自status栏)完成的每一项都将与一年中的每一个月相匹配，并每年进行汇总。我面临的挑战是如何根据月份和随后的年份汇总完成的每一项数据，然后绘制数据。列中数据的值是字符串，将它们转换为整数是另一个挑战。我了解到，我需要具有值"Completed"的状态，并将它们按年进行聚合，以便有两个列，它们将被绘制为x和y。任何关于如何实现这一点的想法都是值得赞赏的。

浏览 3提问于2022-05-05得票数 0

回答已采纳

1回答

如何绘制pyplot中每个x值在y轴上的平均值

、

我正在使用matplotlib.pyplot来可视化我的数据。在熊猫中，我有“hour”和“'favourite_count'”两个栏目。小时的值介于0到24之间。favourite_count是一个连续变量。我想要的是绘制一个条形图，直观地显示每小时的平均favourite_count。目前我正在绘制一个基本的图表，如下所示。在y轴上，它绘制了每个小时的favourite_count的总和/最大值(我不确定是哪一个)。如何绘制可视化小时与average_favorite_count_for_hour的图表 plt.bar(result['hour'], res

浏览 2提问于2018-12-26得票数 2

回答已采纳

1回答

当我使用Value_counts ( Pandas )的groupby时，如何进一步使用

、、

我想形象化每个类别类型中每个比率的数量，所以我使用了 q2 = df.groupby(['Category'])['Rating'].value_counts() 按需要将数据分组(它可以正常工作，正如我所需)，但当我使用 px.bar( q2, x = 'Category', y = 'Rating' ) 我得到了“'DataFrameGroupBy‘对象没有属性' Value_counts’”错误，那么我能做什么来可视化这个Groupby Value_counts数据呢？数据链：

浏览 2提问于2022-03-06得票数 0

1回答

使用chart.js的数据可视化DataTables.js

、、

我希望能够显示我的图表，以响应数据表搜索和/或排序的更改，如使用highcharts的本例所示使用Highcharts.js的数据可视化DataTables.js。 <a href="https://codepen.io/tutsplus/pen/GMVapQ"> <div class="container"> <table id="dt-table"> <thead> <tr> <th>Country</th>

浏览 1提问于2018-04-07得票数 0

2回答

调查所得地块分组资料

、、

我有一个有兴趣变量的数据(分类，这里是Yes，No等等)和一个分组变量(见下文)： import pandas as pd import numpy as np df = pd.DataFrame({ 'ID': range(100), 'group': np.random.choice(['A', 'B', 'C'], 100), 'Response':np.random.choice(['Yes','No','Other'

浏览 5提问于2019-03-02得票数 1

回答已采纳

1回答

如何将DataFrame groupby().agg()的结果转换为新的数据帧

、

听起来很简单但是..。我有一个包含(yy，mm，dd，value1，value2，...)的数据帧df df1 = df.groupby(['yy','dd'], as_index = False).agg({'value1':['count'],'value2':['sum']}) 工作正常，返回一个我可以‘可视化’的df1多索引对象，例如df1.info() 问:如何将这个df1转换为一个“基本的”2D DataFrame。

浏览 2提问于2020-05-23得票数 0

1回答

相对频率或密度曲线的计数图

、、、、

我试图可视化三组数据的分类数据。使用海运，它似乎可以做到这一点(下面的文档链接中的第二个示例类似于我所需要的)。但是，与其计算y轴，还能按组将其按比例计算吗？在链接中的第二个例子中，Man组(蓝色栏)在第一级、第二类和第三级分别约为22%、18%和60%，而不是计数。妇女和儿童团体也是如此。

浏览 1提问于2019-07-14得票数 2

回答已采纳

1回答

如何将Altair boxplot infobox更改为显示平均值而不是中位数？

、、

我已经使用Python中的Altair库创建了一些数据的可视化。当前悬停信息框显示中位数。如何将聚合更改为显示均值？

浏览 19提问于2019-12-05得票数 2

回答已采纳

1回答

如何在实际中绘制平均价值线，而不是每一个值

、、、、

首先，对不起，如果我在这里写的东西没有达到堆叠溢出的标准，我正在尽我最大的努力。我有一个dataframe，大约18k行和89列与足球运动员的信息。例如，我需要绘制一个线条图来可视化年龄和球员的总体评分之间的联系。但当我为之划出一条线时： fig = px.line(df, x="Age", y="Overall") fig.show() 其结果是：这显然不是一个很好的可视化。我想要绘制每个年龄的平均评分，所以这一行显示了年龄和总体评分之间的联系。是否有一个简单的绘图功能，还是我必须自己创建正确的数据？

浏览 2提问于2022-11-21得票数 1

回答已采纳

1回答

使用groupby()绘制销售趋势图

、、、

我想了解如何对此数据集使用groupby或其他函数： Date_ren Quant Y M 2002-03-14 32 2002 3 2002-02-24 31 2002 2 2002-02-21 28 2002 2 ... ... ... ... 2011-04-02 1 2011 4 2013-02-25 1 2013 2 2019-05-02 1 2019 5 2012-01-03 1 2012 1 2014-05-01 1 2014 5 我试图实现的是对这些数据按月到年的良好可视化

浏览 17提问于2020-11-01得票数 1

回答已采纳

1回答

形象化累积巨蟒

、、、

这与post 有关现在我有了下面的数据，我正在尝试将其可视化。 Item Add Subtracts Month Net_Items Monthly_Available_Items C 68 30 1 38 38 C 58 34 2 24 62 C 64 47 3 17 79 C 263 81 4 182 261 C 95 104 5 -9 252 C 38 63 6 -25 227 C 115 95 7 20 247 C 97 112 8 -15 232 代码和图表如下： p

浏览 0提问于2018-08-31得票数 2

回答已采纳

1回答

列表中列表值的c# linq GroupBy

、、、

我有一个对象列表，在对象中有一个字符串列表。我要做的是找出每个字符串值中有多少个。所以用团队中的人说的语言来创建一个简单的例子。 public class PeopleLanguages { public string Name; public List<string> Languages; } 创建测试数据..。 List<PeopleLanguages> peopleLanguages = new List<PeopleLanguages>(); peopleLanguages.Add(new PeopleLanguages { Na

浏览 3提问于2020-02-12得票数 7

回答已采纳

2回答

Pandas groupby操作返回对象，但没有可视对象

、

刚接触Pandas (2天)，并在我的学院奖数据集上运行了以下groupby命令。 df[(df.Award == 'Best Actress') & (df.Winner == 1.0)].groupby('Name') 我收到了以下输出，通常在可视化之前，但这次不是。 <pandas.core.groupby.DataFrameGroupBy object at 0x1166b8cc0> 我期待的是所有获得奥斯卡最佳女主角的女演员的名单，按她们各自的名字分组。为什么不是chart呢？编辑：数据如下所示。。。 Year

浏览 1提问于2017-04-26得票数 1

1回答

如何按年份和日期分组，以及熊猫的总金额

、、、

有人能告诉我如何找到每月收入，分类和可视化它。 Month&Year | Monthly Revenue 0 2016-11 | 261.9600 1 2016-11 | 731.9400 2 2016-06 | 14.6200 3 2015-10 | 957.5775 4 2015-10 | 22.3680 9989 2014-01 | 25.2480 9990 2017-02 | 91.9600 9991 2017-02 | 258.5760 9992 2017-02 |

浏览 6提问于2020-09-19得票数 2

回答已采纳

1回答

如何使用已分组的另一个数据帧的产品创建新的数据帧？

、

输入： dfB=dfA.groupby('labelA').labelB.nlargest(3) 输出： labelA G 5309 415004880.00 6016 268492764.00 5570 191452396.00 PG 6687 486295561.00 5943 400738009.00 5987 368061265.00 PG-13 6380 936662225.00 6391 652270625.00

浏览 0提问于2018-10-27得票数 1

1回答

我怎样才能绘制出熊猫数据栏中一列中间值的堆叠条形图呢？

、、

所以我是一个新手，学习熊猫的数据可视化(python)，我的任务是为30到35岁的年龄组创建一个中间WeekHrs和CodeRevHrs的叠加图表。下面是我的代码，我提取了年龄列上的数据应用过滤器，下面是我的数据集的前五行 age_filter= agework [(agework["age"]>= 30 )&(agework["age"]<=35)] median_weekhrs= age_filter["Weekhrs"].median() median_coderev= age_filter["CodeRev

浏览 0提问于2021-02-06得票数 1

回答已采纳

2回答

如何分配唯一的ID来检测熊猫数据中的重复行？

、、

我使用的是一只大熊猫的dataframe，它有几个类似于这样的专栏： A B C D John Tom 0 1 Homer Bart 2 3 Tom Maggie 1 4 Lisa John 5 0 Homer Bart 2 3 Lisa John 5 0 Homer Bart 2 3 Homer Bart 2 3 Tom Maggie 1 4 如何为每个重复行分配唯一的id？例如：

浏览 0提问于2018-06-29得票数 7

回答已采纳

1回答

如何将GoogleCharts插件与CakePHP结合使用？

、、、

我一直在处理不同的可视化插件，这些插件允许您以图表的形式表示数据。遵循我的，它似乎有点过时，出于绝望，我寻找其他插件，可能提供类似的选择。现在，我已经意识到，googleCharts可能正是我所需要的，而事实证明，有一个应该能够满足我的需要。然而，我在理解我将如何实现它时遇到了一点困难。根据我所看到的和插件文档中的内容，它以结果数组的形式接受数据，然后从数组中迭代，并显示列键中指定的匹配字段。(如果我说的不对，请解释。) 否则，我正在寻找一种方法，可以使用从3个查询返回的值生成饼图，如下所示： $users_donor = $this->User->find(&

浏览 0提问于2014-02-16得票数 0

回答已采纳

1回答

如何计算每个bin中的点数？

、、、、

我有一个x，y坐标的pandas df，我想知道如何计算每个bin中的点数。我知道你可以使用plt.hist2d()来可视化这一过程，但我想做一个数组/矩阵来保存每一个bin的计数。我已经使用：bins = (df // .1 * .1).round(1).stack().groupby(level=0).apply(tuple)对x，y坐标进行了绑定，其中df是： x y -2.319059 -4.057801 1.514416 -2.325972 -2.642251 -1.004367 -1.486476 -2.535654 -0.844162 -3.07872

浏览 7提问于2019-08-09得票数 1

回答已采纳

1回答

计算随后每组2排熊猫的平均数。

、、、

我试图为所有数据帧计算每个后续的2行组的平均值。我想我是用下面的一行来理解的：df.groupby(np.arange(len(df))//2).mean() 然而，问题是并不是所有的值都是数字的。在这种情况下，如果组的第二行是数值，而第一行不是数值，则值与第二行保持相同。如果两行都是非数字的，则应将值赋值为0。为了进行更好的可视化，我有以下数据： Well Ct 0 A1 Undetermined 1 A2 Undertermined 2 A3 Undetermined 3 A4 41.2 4 B1 42 5

浏览 0提问于2019-04-29得票数 0

回答已采纳

1回答

如何用折线图来可视化熊猫DataFrame？

、

我有一个带有信息的熊猫DataFrame，df.info()打印如下， <class 'pandas.core.frame.DataFrame'> Int64Index: 6661 entries, 0 to 6660 Data columns (total 3 columns): value 6661 non-null float64 country 6477 non-null object outlier 6661 non-null int64 dtypes: float64(1), int64(1), object(1) memory u

浏览 7提问于2017-03-10得票数 0

回答已采纳

1回答

熊猫:按日期合并两行数据，但不包括其他行。

、

我一直在玩约翰霍普金斯大学提供的新冠肺炎数据。我已经创建了一个Python脚本来从Github提取数据，进行一些数据清理，然后加载到我创建的一个小型SQL Server数据库中。所有这些都很好。有些数据需要更多的按摩才能准确地可视化。有丢失的FIPS号码，缺失的lat/lons，等等。我现在试图解决的问题是合并确认的计数，其中有空的FIPS号码和FIPS号码，在那里其他的一切都是一样的。以下是数据的示例：在我的搜索中，我发现了一组和一组： df1.groupby(['STATE','COUNTRY','LAT','LON&#

浏览 1提问于2020-04-27得票数 0

回答已采纳

1回答

获取pandas数据帧中唯一值的计数

、、

我正在尝试获取pandas dataframe中某列的唯一值的计数。示例数据如下： In [3]: df = pd.DataFrame([[1, 1], [2, 1], [3, 2], [4, 3], [5, 1]], columns=['AppointmentId', 'PatientId']) In [4]: df Out[4]: AppointmentId PatientId 0 1 1 1 2 1 2 3 2 3

浏览 3提问于2018-01-22得票数 0

回答已采纳

3回答

迭代组对象上的value_counts()结果

、

我有一个像df = pd.DataFrame({'ID':[1,1,2,2,3,3,4,4,5,5,5],'Col1':['Y','Y','Y','N','N','N','Y','Y','Y','N','N']})一样的数据格式。我想做的是按“ID”列分组，然后获取三个条件的统计信息：多少组只有'Y‘s多少个组至少有1’Y‘和至少1’N‘有多少组只有’N‘’‘ groups =

浏览 0提问于2020-12-01得票数 2

回答已采纳