我在同一行中有一个具有多个值的数据帧。
index price
1 1000,2000,3000
2 2000,500
数据帧有12行,并不是所有的price行都有相同的长度。我想用index和price绘制x轴上的index和y轴上的price .我有以下密码-
ggplot(data_m,
aes(x = 1:12,
y = data_m$price))
我得到了错误- Error: Aesthetics must be either length 1 or the same as the data (12): y
如何绘制价格栏中的每个值?
我有一个像这样的熊猫数据框 ? 我想把它转换成下面的代码(不使用任何循环!): ? 你知道怎么做吗?? 如果图像不显示: 我有一个包含2列的数据帧: Name和Hobbys。我有以下几行代码: Anna drawing
Anna swimming
Anna skiing
Lisa running
Lisa singing
Tom drawing 我想把它转换成一个有4列的数据帧:姓名,兴趣1,兴趣2,兴趣3。并且有以下几行: Anna drawing swimming skiing
Lisa running singing NaN
Tom drawing NaN NaN
我有一个关于将几个数组组合成一个数组的问题。我有一个长度为1000的列表,在列表的每个元素中有16个维度为100的数组,我想要实现的是一个包含1000个元素的列表,每个元素都有一个维度为1600的数组。如何实现这一点:我尝试了以下方法:返回16'000 x 100维度的x=np.concetate(x, axis=0)和返回16 x 100'000维度的x=np.concetate(x, axis=1)。我还尝试了x=np.vstack和x=np.hstack,但我自己无法获得它。有人能帮帮我吗? 谢谢! 编辑:最小工作样本: 我有类似这样的东西,首先是数据帧 Date
我有一张excel表格,我把它读进了熊猫的数据框里。看起来是这样的: KEY_FIELD_NAME KEY_FIELD_VAL_ORIG KEY_FIELD_VAL_NEW
NAME XXX YYY
AGE 11 22
INCOME 100 200
NAME ABC DEF 我还有另一个熊猫数据帧(df_
我有当前的代码,用于读取文件,然后从数据帧的顶部删除一行,直到一个特定值为‘意外ID’。 def read_file(file):
"""
This function reads the Excel file, chooses the sheet that contains the information that we need.
The sheet is then read and the dataframe is created.
"""
df = pd.ExcelFile(file)
我的目标是创建一个pandas面板,我目前有一个csv,示例如下:
Year From country To country Points
2005 Albania Albania 0
2005 Albania Bosnia & Herzegovina 0
2005 Albania Croatia 2
2005 Albania Cyprus 7
2005 Albania
假设我想创建一个多索引和多列的数据帧: X Y
Planet Continent Country A B C D
Earth Europe England 0.3 0.5 0.6 0.8
Europe Italy 0.1 0.2 0.4 1.2
Mars Tempe Sirtys 3.2 4.5 2.3 4.2 我想通过迭代收集数据帧的每一行来做到这一点, row1 = np.array(['Earth'
假设我有一个Panda DataFrame,它看起来如下:
输入
Name Key Val
David A 1
Roe B 2
John A 3
Nat B 4
我想按键拆分,按名称分组。
输出
Name A B
David 1 nan
John 3 nan
Nat nan 4
Roe nan 2
你能建议一下做这件事的方法吗?
下面是生成数据帧的代码。
import pandas as pd
# Initializing the nested list with Data-set
data = [
我想请教一下您的意见。 如何将第一个数据帧转换为下面的第二个数据帧? 大陆、国家和位置是列索引的名称。 Polution_level将被添加为第一个数据帧上出现的值的列名。 Continent Asia Asia Africa Europe
Country Japan China Mozambique Portugal
Location Tokyo Shanghai Maputo Lisbon
Date
01 Jan 20 250
假设我生成的数据帧如下所示
dataframe <- data.frame(name = (rep(c('A', 'B', 'C', 'D'), 25)), probe = rep(number, each = 4), a = rnorm(100), b = (rnorm(100)+1), c = (rnorm(100)+5))
> head(dataframe)
name probe a b c
1 A 1 0.03394554 2.973