我有一个坐标(X,Y)的数据帧,我需要得到一个具有最高密度的点的坐标的列表。 我使用坐标(X,Y)的平均值,并从该点计算到所有其他点的距离,然后对它们进行排序,但平均值并不总是在最密集的点。使用gaussian_kde,我可以可视化最密集的点,但我不知道如何将这些点提取到列表中。 import numpy as np
import pandas as pd
import pylab as plt
import random
from scipy.stats import gaussian_kde
from scipy.spatial.distance import cdist
from s
我正在尝试使用pandas在数据帧中搜索数据,然后使用收集的数据将这些数据插入到新数据帧上的特定位置。
假设我的代码是这样的:
If row contains [A] then
x=data.iloc[<row>, <column selection>]
y=data.iloc[<row>, <column selection>]
z=data.iloc[<row>, <column selection>]
insert x to newdataframe at location (y,z
在我尝试按country列对我的Pandas数据帧进行排序后:
times_data2.reindex_axis(sorted(times_data2['country']), axis=1)
我的数据帧是这样的:
Argetina Argentina .... United States of America ...
NaN Nan .... NaN ....
Iam使用DBSCAN将坐标聚类在一起,然后使用凸包在每个聚类周围绘制“多边形”。然后,我想从我的凸壳形状中构造出地理熊猫多边形,用于空间连接。
import pandas as pd, numpy as np, matplotlib.pyplot as plt
from sklearn.cluster import DBSCAN
from scipy.spatial import ConvexHull
Lat=[10,10,20,23,27,28,29,34,11,34,66,22]
Lon=[39,40,23,21,11,29,66,33,55,22,11,55]
D=list(z
我有x,y坐标,我想表示2d轴,然后是图的值,我想要成为一个热图,对应于相应的x,y坐标的概率。这是我现在得到的样本数据。
import numpy as np
import random
import pandas as pd
x = np.linspace(-1,1,200)
y = np.linspace(-1,1,200)
z = [random.uniform(0, 1) for val in range(200)]
df = pd.DataFrame({'x':x,'y':y,'z':z})
我希望它看起来像这样(显然有不同的轴
当我将geom_tile()与ggplot2和离散缩放一起使用时,标签在x轴上按升序排列,在y轴上按降序排列:
#some sample data
a <- runif(400)
a <- matrix(a, ncol=20)
colnames(a) <- letters[seq( from = 1, to = 20 )]
rownames(a) <- letters[seq( from = 1, to = 20 )]
a <- melt(a)
当我绘制数据帧a时,结果如下所示:
ggplot(a, aes(X1, X2, fill = value)) + geo
我正在试图传递一个包含csv坐标、y坐标、z坐标的y文件。我正在使用Python的NumPy包来完成这个任务,如下代码所示:
enter code here#
!/usr/bin/python
from __future__ import print_function
import numpy as np
import pandas as pd
pdb_file=open('/home/josh/Documents/cordinates_all.csv')
x_new_file=open('/home/josh/Documents/x_new_cordinates.
如何从以下名为think_or_feel的Pandas数据帧创建等高线图: think feel
cNEU cOPN
y n 27 20
n n 40 23
y y 43 25
n y 97 63 我尝试过以下几种方法: X=think_or_feel.columns
Y=think_or_feel.index
Z=think_or_feel.values
x,y=np.meshgrid(X, Y)
蓄积期
在脚本中,相同大小的数据矩阵X被某些模型(这里只是随机数生成器)重新估计,并在有限的试验过程中累积/保存在矩阵Y中。
import numpy as np
from numpy.random import random
import pandas as pd
k = 3 #shape
t = 5 #trials
Y = np.zeros((t,k,k))
for i in range(5):
X = random((k,k)) #2D estimate
X = pd.DataFrame(X)
Y[i,:,:] = X #3D tensor
我有一组笛卡尔坐标对,每对都有一个二进制变量。我正在绘制一个热图,在每个容器中,我计算掉到这个容器中的坐标的分数,其中二进制变量是1。
我的问题是轴心。如下图所示,产生的轴是表示bin边界的字符串。我希望轴是笛卡尔坐标。有什么简单的方法来改变这种状况吗?
import numpy as np
import pandas as pd
import seaborn as sb
np.random.seed(0)
x = np.random.uniform(0,100, size=200)
y = np.random.uniform(0,100, size=200)
z = np.random.ch
我目前正在尝试执行以下代码:
z = y-(X_array*HedgeRatio)
变量具有以下属性:
Hedge Ratio = 0.489552919785
Hedge Ratio type = <type 'numpy.float64'>
y type = <class 'pandas.core.frame.DataFrame'>
X_array type = <type 'numpy.ndarray'>
y length = 1554
X_array length = 1554
但是,当它执行时,