Установка данных с использованием UnivariateSpline в scipy python

У меня есть экспериментальные данные, к которым я пытаюсь подобрать кривую, используя функцию UnivariateSpline в scipy. Данные выглядят так:

 x         y
13    2.404070
12    1.588134
11    1.760112
10    1.771360
09    1.860087
08    1.955789
07    1.910408
06    1.655911
05    1.778952
04    2.624719
03    1.698099
02    3.022607
01    3.303135    

Вот что я делаю:

import matplotlib.pyplot as plt
from scipy import interpolate
yinterp = interpolate.UnivariateSpline(x, y, s = 5e8)(x) 
plt.plot(x, y, 'bo', label = 'Original')
plt.plot(x, yinterp, 'r', label = 'Interpolated')
plt.show()

Как выглядит:

Curve fit

Мне было интересно, думал ли кто-нибудь о других вариантах подгонки кривой, которые могли бы иметь scipy? Я относительно новичок в scipy.

Спасибо!

Ответ 1

Есть несколько проблем.

Первая проблема - порядок значений x. Из документации для scipy.interpolate.UnivariateSpline находим

x : (N,) array_like
    1-D array of independent input data. MUST BE INCREASING.

Стресс, добавленный мной. Для данных, которые вы указали, x находится в обратном порядке. Чтобы отладить это, полезно использовать "нормальный" сплайн, чтобы убедиться, что все имеет смысл.

Вторая проблема, а также еще одна актуальная для вашей проблемы, связана с параметром s. Что оно делает? Снова из документации мы находим

s : float or None, optional
    Positive smoothing factor used to choose the number of knots.  Number
    of knots will be increased until the smoothing condition is satisfied:

    sum((w[i]*(y[i]-s(x[i])))**2,axis=0) <= s

    If None (default), s=len(w) which should be a good value if 1/w[i] is
    an estimate of the standard deviation of y[i].  If 0, spline will
    interpolate through all data points.

Итак, s определяет, насколько близко интерполированная кривая должна прийти к точкам данных, в смысле наименьших квадратов. Если мы установим значение очень большое, то сплайн не должен приближаться к точкам данных.

В качестве полного примера рассмотрим следующий

import scipy.interpolate as inter
import numpy as np
import pylab as plt

x = np.array([13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 1])
y = np.array([2.404070, 1.588134, 1.760112, 1.771360, 1.860087,
          1.955789, 1.910408, 1.655911, 1.778952, 2.624719,
          1.698099, 3.022607, 3.303135])
xx = np.arange(1,13.01,0.1)
s1 = inter.InterpolatedUnivariateSpline (x, y)
s1rev = inter.InterpolatedUnivariateSpline (x[::-1], y[::-1])
# Use a smallish value for s
s2 = inter.UnivariateSpline (x[::-1], y[::-1], s=0.1)
s2crazy = inter.UnivariateSpline (x[::-1], y[::-1], s=5e8)
plt.plot (x, y, 'bo', label='Data')
plt.plot (xx, s1(xx), 'k-', label='Spline, wrong order')
plt.plot (xx, s1rev(xx), 'k--', label='Spline, correct order')
plt.plot (xx, s2(xx), 'r-', label='Spline, fit')
# Uncomment to get the poor fit.
#plt.plot (xx, s2crazy(xx), 'r--', label='Spline, fit, s=5e8')
plt.minorticks_on()
plt.legend()
plt.xlabel('x')
plt.ylabel('y')
plt.show()

Result from example code