首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何在部分空规则网格内插值/外推?

如何在部分空规则网格内插值/外推?
EN

Stack Overflow用户
提问于 2018-05-02 09:19:11
回答 2查看 1.1K关注 0票数 0

我想要创建一个python函数,在一个部分为空的网格中线性内插,并得到一个最接近的外推。

假设我在熊猫DataFrame中存储了以下数据:

代码语言:javascript
运行
复制
In [1]: import numpy as np
In [2]: import pandas as pd

In [3]: x = [0,1,2,3,4]
In [4]: y = [0.5,1.5,2.5,3.5,4.5,5.5]
In [5]: z = np.array([[np.nan,np.nan,1.5,2.0,5.5,3.5],[np.nan,1.0,4.0,2.5,4.5,3.0],[2.0,0.5,6.0,1.5,3.5,np.nan],[np.nan,1.5,4.0,2.0,np.nan,np.nan],[np.nan,np.nan,2.0,np.nan,np.nan,np.nan]])
In [6]: df = pd.DataFrame(z,index=x,columns=y)
In [7]: df
Out[7]:
    0.5  1.5  2.5  3.5  4.5  5.5
 0  NaN  NaN  1.5  2.0  5.5  3.5
 1  NaN  1.0  4.0  2.5  4.5  3.0
 2  2.0  0.5  6.0  1.5  3.5  NaN
 3  NaN  1.5  4.0  2.0  NaN  NaN
 4  NaN  NaN  2.0  NaN  NaN  NaN 

我希望得到函数myInterp,它返回数据边界内的线性插值(即不是NaN值),并得到最近的外界外推(即NaN值或无值),例如:

代码语言:javascript
运行
复制
In [1]: myInterp([1.5,2.5]) #linear interpolation
Out[1]: 5.0

In [2]: myInterp([1.5,4.0]) #bi-linear interpolation
Out[2]: 3.0

In [3]: myInterp([0.0,2.0]) #nearest extrapolation (inside grid)
Out[3]: 1.5

In [4]: myInterp([5.0,2.5]) #nearest extrapolation (outside grid)
Out[4]: 2.0

我尝试了许多组合的scipy.interpolate软件包,但没有成功,谁有建议如何做呢?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2020-02-24 14:03:21

由于scipy.interp2d不处理Nans,所以解决方案是在使用interp2d之前填充DataFrame中的NaNs。这可以通过使用pandas.interpolate函数来完成。

在前面的示例中,以下内容提供了所需的输出:

代码语言:javascript
运行
复制
In [1]: from scipy.interpolate import interp2d

In [2]: df = df.interpolate(limit_direction='both',axis=1,inplace=True)
In [3]: myInterp = interp2d(df.index,df.columns,df.values.T)

In [4]: myInterp(1.5,2.5)
Out[4]: array([5.])

In [5]: myInterp(1.5,4.0)
Out[5]: array([3.])

In [6]: myInterp(0.0,2.0)
Out[6]: array([1.5])

In [7]: myInterp(5.0,2.5)
Out[7]: array([2.])
票数 0
EN

Stack Overflow用户

发布于 2018-05-02 11:46:11

是的,不幸的是,西班不和南方人打交道

从医生那里:

代码语言:javascript
运行
复制
Note that calling interp2d with NaNs present in input values results in undefined behaviour.

甚至在np.masked_array中掩蔽nans也是不成功的。

因此,我的建议是从z中删除所有nan条目,方法是利用这个机会向sp.interp2d提供唯一有效数据的x-和y-坐标的完整列表,并留下z:

代码语言:javascript
运行
复制
X=[];Y=[];Z=[]                     # initialize new 1-D-lists for interp2
for i, xi in enumerate(x):         # iterate through x
    for k, yk in enumerate(y):     # iterate through y
        if not np.isnan(z[i, k]):  # check if z-value is valid...
            X.append(xi)           # ...and if so, append coordinates and value to prepared lists
            Y.append(yk)
            Z.append(z[i, k])

这种方式至少可以使sp.interp2d工作并给出一个结果:

代码语言:javascript
运行
复制
ip = sp.interpolate.interp2d(X,Y,Z)

但是,结果中的值不会让您满意:

代码语言:javascript
运行
复制
In: ip(x,y)
Out: 
array([[ 18.03583061,  -0.44933642,   0.83333333,  -1.        , -1.46105542],
       [  9.76791531,   1.3014037 ,   2.83333333,   1.5       ,  0.26947229],
       [  1.5       ,   3.05214381,   4.83333333,   4.        ,   2.        ],
       [  2.        ,   3.78378051,   1.5       ,   2.        ,   0.8364618 ],
       [  5.5       ,   3.57039277,   3.5       ,  -0.83019815,  -0.7967441 ],
       [  3.5       ,   3.29227922,  17.29607177,   0.        ,   0.        ]])

与输入数据相比:

代码语言:javascript
运行
复制
In:z
Out: 
array([[ nan,  nan,  1.5,  2. ,  5.5,  3.5],
       [ nan,  1. ,  4. ,  2.5,  4.5,  3. ],
       [ 2. ,  0.5,  6. ,  1.5,  3.5,  nan],
       [ nan,  1.5,  4. ,  2. ,  nan,  nan],
       [ nan,  nan,  2. ,  nan,  nan,  nan]])

但是IMHO --这是因为数据的梯度变化太高了。更多的是关于数据样本数量较少的问题。

我希望这只是一个测试数据集,您的实际应用程序具有更平滑的梯度和更多的示例。如果能成功我会很高兴的..。

然而,一个零梯度数组的琐碎测试--只被nans一点点破坏--可能暗示插值应该有效,而外推法仅部分正确:

代码语言:javascript
运行
复制
In:ip(x,y)
Out: 
array([[ 3.        ,  3.        ,  3.        ,  3.        ,  0.        ],
       [ 3.        ,  3.        ,  3.        ,  3.        ,  1.94701008],
       [ 3.        ,  3.        ,  3.        ,  3.        ,  3.        ],
       [ 3.        ,  3.        ,  3.        ,  3.        ,  1.54973345],
       [ 3.        ,  3.        ,  3.        ,  3.        ,  0.37706713],
       [ 3.        ,  3.        ,  2.32108317,  0.75435203,  0.        ]])

由琐碎的测试输入产生的

代码语言:javascript
运行
复制
In:z
Out: 
array([[ nan,  nan,   3.,   3.,   3.,   3.],
       [ nan,   3.,   3.,  nan,   3.,   3.],
       [  3.,   3.,   3.,   3.,   3.,  nan],
       [ nan,   3.,   3.,   3.,  nan,  nan],
       [ nan,  nan,   3.,  nan,  nan,  nan]])

PS:看看右边:甚至有完全改变的有效条目,即犯了错误,这会在随后的分析中引入错误。

但令人惊讶的是:立方版本在这里的表现要好得多:

代码语言:javascript
运行
复制
In:ip = sp.interpolate.interp2d(X,Y,Z, kind='cubic')

In:ip(x,y)
Out: 
array([[ 3.        ,  3.        ,  3.        ,  3.02397028,  3.0958811 ],
       [ 3.        ,  3.        ,  3.        ,  3.        ,  3.        ],
       [ 3.        ,  3.        ,  3.        ,  3.        ,  3.        ],
       [ 3.        ,  3.        ,  3.        ,  3.        ,  3.        ],
       [ 3.        ,  3.        ,  3.        ,  2.97602972,  2.9041189 ],
       [ 3.        ,  3.        ,  3.        ,  2.9041189 ,  2.61647559]])

In:z
Out: 
array([[ nan,  nan,   3.,   3.,   3.,   3.],
       [ nan,   3.,   3.,  nan,   3.,   3.],
       [  3.,   3.,   3.,   3.,   3.,  nan],
       [ nan,   3.,   3.,   3.,  nan,  nan],
       [ nan,  nan,   3.,  nan,  nan,  nan]])
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50131099

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档