import numpy as np
import matplotlib.pyplot as plt
from astropy.modeling.functional_models import Gaussian1D

def plot_shaded_gauss(mean, sig):
    gmodel = Gaussian1D(amplitude=1., mean=mean, stddev=sig)

    psax = np.arange(-2,6,0.02)
    gauss = gmodel(psax)
    psax2 = np.arange(-2,sig,0.02)
    gauss2 = gmodel(psax2)

    fig = plt.figure()
    ax = fig.add_subplot(111)
    ax.plot(psax, gauss)
    ax.fill_between(psax2, gauss2)
    ax.set_xticks([0,sig, mean], ['0','$\\Sigma_i$','$\\bar{\\psi}_i$'])
    ax.set_yticks([])
    ax.axvline(x=0, color='black')
    ax.axvline(x=mean, color='gray', linestyle='dashed')
    sigheight = np.exp(-0.5)
    ax.plot([mean-sig,mean], [sigheight,sigheight], color='gray')
    ax.text(mean-0.5*sig, sigheight, '$\\Sigma_i$', ha='center', va='bottom')
    ax.text(0.98, 0.9, '$\\bar{\\psi}_i / \\Sigma_i = $'+f'{mean/sig}', transform=ax.transAxes, ha='right')
    
plot_shaded_gauss(2.6, 1.)


plot_shaded_gauss(1.3,1.)


plot_shaded_gauss(3.8, 1.)


from scipy.special import erfc

pssigax = np.arange(0., 3.5, 0.01)
uplim_term = -2. * np.log(erfc((pssigax - 1.) / np.sqrt(2.)))
lin_term = pssigax**2

plt.plot(pssigax, uplim_term, label='Upper limit term')
plt.plot(pssigax, lin_term, label='$\psi=0$ linear term')
plt.xlabel('$\\bar{\psi}_i / \Sigma_i$')
plt.legend(loc='best')

<matplotlib.legend.Legend at 0x11f91ded0>


pssigax = np.arange(0., 3.5, 0.01)
uplim_term = -2. * np.log(erfc((pssigax - 1.) / np.sqrt(2.)))
uplim_term -= uplim_term[0]
lin_term = pssigax**2

plt.plot(pssigax, uplim_term, label='Upper limit term')
plt.plot(pssigax, lin_term, label='$\psi=0$ linear term')
plt.xlabel('$\\bar{\psi}_i / \Sigma_i$')
plt.legend(loc='best')

<matplotlib.legend.Legend at 0x11fb2e020>


def broken_exponential(R, parms):
    A, a, b, R0 = parms
    inner_mask = (R <= R0)
    outer_mask = (R > R0)
    inner_values = A * np.exp(-R/a)
    outer_values = A * np.exp(-R0/a - (R-R0)/b)
    model = inner_mask*inner_values + outer_mask*outer_values
    return model


A_true = 1.
a_true = 0.7
b_true=2.
R0_true = 2.
trueparms = np.array([A_true, a_true, b_true, R0_true])

rax = np.arange(0,6,0.1)
plt.plot(rax, broken_exponential(rax, trueparms))
plt.yscale('log')


Ndata = 50
bg = 3e-2  # background level
noise_ratio = 0.3 # 30% errors
rng = np.random.default_rng(1)
Rdata = rng.uniform(low=0., high=6., size=Ndata)
underlying_true = broken_exponential(Rdata, trueparms)
underlying_with_bg = underlying_true + bg
sigmadata = noise_ratio * underlying_with_bg
valuedata = rng.normal(loc=underlying_with_bg, scale=sigmadata, size=Ndata) - bg


plt.errorbar(Rdata, valuedata, sigmadata, fmt='.')
plt.yscale('log')


np.where(valuedata < 0.)

(array([ 6, 23, 33, 46, 49]),)


from scipy.optimize import minimize


guess = trueparms + rng.uniform(low=-2, high=2, size=4)
print('True:', trueparms)
print('Initial guess:',guess)

True: [1.  0.7 2.  2. ]
Initial guess: [1.61546404 0.424907   3.46928202 2.52854047]


def sumsquares(parms, R, y, sigma):
    ss = ((y-broken_exponential(R,parms)) / sigma)**2
    return np.sum(ss)


small = 1e-7
linfit_results = minimize(sumsquares, guess, args=(Rdata,valuedata,sigmadata), \
                         bounds=((small,None),(None,None),(None,None),(small,None)) )
linfit_results

  message: CONVERGENCE: REL_REDUCTION_OF_F_<=_FACTR*EPSMCH
  success: True
   status: 0
      fun: 33.27617051198573
        x: [ 9.653e-01  6.849e-01  1.751e+00  1.819e+00]
      nit: 34
      jac: [ 3.560e-04  2.674e-03  4.846e-04 -6.126e-01]
     nfev: 390
     njev: 78
 hess_inv: <4x4 LbfgsInvHessProduct with dtype=float64>


plt.errorbar(Rdata, valuedata, sigmadata, fmt='.')
plt.plot(rax, broken_exponential(rax, linfit_results.x))
plt.yscale('log')


print(f'True: {trueparms}')
print(f'Fit: {linfit_results.x}')

True: [1.  0.7 2.  2. ]
Fit: [0.96529334 0.68488464 1.75129484 1.81916895]


valuedata_log = np.log10(valuedata)
sigmadata_log = sigmadata / (valuedata * np.log(10))
positivep = (valuedata > 0.)

/var/folders/nv/wnbn9lg96q763fz6ndnnnpt40000gq/T/ipykernel_92252/2062580544.py:1: RuntimeWarning: invalid value encountered in log10
  valuedata_log = np.log10(valuedata)


def sumlogsquares(parms, R, y, sigma):
    ss = ((y-np.log10(broken_exponential(R,parms))) / sigma)**2
    return np.sum(ss)


logfit_results = minimize(sumlogsquares, guess, args=(Rdata[positivep],valuedata_log[positivep],sigmadata_log[positivep]), \
                         bounds=( (small,None),(None,None),(None,None),(small,None) ) )
logfit_results

  message: CONVERGENCE: REL_REDUCTION_OF_F_<=_FACTR*EPSMCH
  success: True
   status: 0
      fun: 14.324623894190887
        x: [ 1.064e+00  6.996e-01  2.414e+00  1.911e+00]
      nit: 28
      jac: [ 4.174e-05  3.286e-05  4.441e-06 -5.684e-06]
     nfev: 205
     njev: 41
 hess_inv: <4x4 LbfgsInvHessProduct with dtype=float64>


plt.errorbar(Rdata, valuedata, sigmadata, fmt='.')
plt.plot(rax, broken_exponential(rax, logfit_results.x))
plt.yscale('log')


print(f'True: {trueparms}')
print(f'Fit: {logfit_results.x}')

True: [1.  0.7 2.  2. ]
Fit: [1.06377183 0.69960074 2.414167   1.91123236]


def sum_uplimterm(parms, R, y, sigma):
    pssig = broken_exponential(R,parms) / sigma
    VLARGE = 1e7
    erfterm = erfc((pssig - 1.) / np.sqrt(2.))
    toobigp = (erfterm == 0.)
    uls = -2. * np.log(erfterm)
    uls[toobigp] = VLARGE
    return np.sum(uls)

def sum_ulsscombi(parms, R, y, sigma):
    positivep = (y > 0.)
    uplimp = (y <= 0.)

    logy = np.log10(y[positivep])
    logsigma = sigma[positivep] / (y[positivep] * np.log(10))

    ss = sumlogsquares(parms, R[positivep], logy, logsigma)
    uls = sum_uplimterm(parms, R[uplimp], y[uplimp], sigma[uplimp])
    return ss + uls


upfit_results = minimize(sum_ulsscombi, guess, args=(Rdata,valuedata,sigmadata), \
                         bounds=( (small,None),(None,None),(None,None),(small,None) ) )
upfit_results

  message: CONVERGENCE: REL_REDUCTION_OF_F_<=_FACTR*EPSMCH
  success: True
   status: 0
      fun: 19.541365585287167
        x: [ 1.064e+00  6.996e-01  2.085e+00  1.900e+00]
      nit: 31
      jac: [ 7.780e-05  1.819e-04 -3.695e-05  9.699e-05]
     nfev: 185
     njev: 37
 hess_inv: <4x4 LbfgsInvHessProduct with dtype=float64>


plt.errorbar(Rdata, valuedata, sigmadata, fmt='.')
plt.plot(rax, broken_exponential(rax, upfit_results.x))
plt.yscale('log')


print(f'True: {trueparms}')
print(f'Fit: {upfit_results.x}')

True: [1.  0.7 2.  2. ]
Fit: [1.06377039 0.69960177 2.08535693 1.89951091]


def sum_loglincombi(parms, R, y, sigma):
    positivep = (y > 0.)
    uplimp = (y <= 0.)

    logy = np.log10(y[positivep])
    logsigma = sigma[positivep] / (y[positivep] * np.log(10))

    logs = sumlogsquares(parms, R[positivep], logy, logsigma)
    lins = sumsquares(parms, R[uplimp], y[uplimp], sigma[uplimp])
    return logs+lins


loglinfit_results = minimize(sum_loglincombi, guess, args=(Rdata,valuedata,sigmadata), \
                         bounds=( (small,None),(None,None),(None,None),(small,None) ) )
loglinfit_results

  message: CONVERGENCE: REL_REDUCTION_OF_F_<=_FACTR*EPSMCH
  success: True
   status: 0
      fun: 30.995764579410178
        x: [ 1.064e+00  6.996e-01  1.993e+00  1.905e+00]
      nit: 33
      jac: [-2.522e-05 -2.132e-06  1.563e-05 -3.446e-05]
     nfev: 195
     njev: 39
 hess_inv: <4x4 LbfgsInvHessProduct with dtype=float64>


plt.errorbar(Rdata, valuedata, sigmadata, fmt='.')
plt.plot(rax, broken_exponential(rax, upfit_results.x))
plt.yscale('log')


print(f'True: {trueparms}')
print(f'Fit: {loglinfit_results.x}')

True: [1.  0.7 2.  2. ]
Fit: [1.06377108 0.69960087 1.99338365 1.90490039]


def sumlogsquares_bias(parms, R, psi, Sigma, bias):
    psi_bias = psi + bias
    sigma_bias = Sigma / (psi_bias * np.log(10))
    ss = ((np.log10(psi_bias)-np.log10(broken_exponential(R,parms)+bias)) / sigma_bias)**2
    return np.sum(ss)


biasratio = 1.2
bias = biasratio * np.abs(np.min(valuedata))
bias12fit_results = minimize(sumlogsquares_bias, guess, args=(Rdata,valuedata,sigmadata,bias), \
                         bounds=( (small,None),(None,None),(None,None),(small,None) ) )
bias12fit_results

  message: CONVERGENCE: REL_REDUCTION_OF_F_<=_FACTR*EPSMCH
  success: True
   status: 0
      fun: 18.62868486687422
        x: [ 1.063e+00  6.944e-01  2.168e+00  1.871e+00]
      nit: 29
      jac: [-3.623e-01 -7.258e-02  7.504e-02 -1.381e-01]
     nfev: 430
     njev: 86
 hess_inv: <4x4 LbfgsInvHessProduct with dtype=float64>


plt.errorbar(Rdata, valuedata, sigmadata, fmt='.')
plt.plot(rax, broken_exponential(rax, bias12fit_results.x))
plt.yscale('log')


print(f'True: {trueparms}')
print(f'Fit: {bias12fit_results.x}')

True: [1.  0.7 2.  2. ]
Fit: [1.0633071  0.694375   2.16770573 1.87098871]


biasratio = 2.0
bias = biasratio * np.abs(np.min(valuedata))
bias20fit_results = minimize(sumlogsquares_bias, guess, args=(Rdata,valuedata,sigmadata,bias), \
                         bounds=( (small,None),(None,None),(None,None),(small,None) ) )
bias20fit_results

  message: ABNORMAL_TERMINATION_IN_LNSRCH
  success: False
   status: 2
      fun: 21.556226609647357
        x: [ 1.064e+00  6.943e-01  2.060e+00  1.871e+00]
      nit: 38
      jac: [-1.954e-05  1.485e-04 -1.670e-05  9.059e-01]
     nfev: 530
     njev: 106
 hess_inv: <4x4 LbfgsInvHessProduct with dtype=float64>


plt.errorbar(Rdata, valuedata, sigmadata, fmt='.')
plt.plot(rax, broken_exponential(rax, bias20fit_results.x))
plt.yscale('log')


print(f'True: {trueparms}')
print(f'Fit: {bias20fit_results.x}')

True: [1.  0.7 2.  2. ]
Fit: [1.06426452 0.69429758 2.06016368 1.87098871]


biasratio = 3.0
bias = biasratio * np.abs(np.min(valuedata))
bias30fit_results = minimize(sumlogsquares_bias, guess, args=(Rdata,valuedata,sigmadata,bias), \
                         bounds=( (small,None),(None,None),(None,None),(small,None) ) )
bias30fit_results

  message: CONVERGENCE: REL_REDUCTION_OF_F_<=_FACTR*EPSMCH
  success: True
   status: 0
      fun: 23.956724221854238
        x: [ 1.062e+00  6.941e-01  1.978e+00  1.871e+00]
      nit: 29
      jac: [ 1.719e-01  3.255e-01  5.381e-03  1.796e-01]
     nfev: 370
     njev: 74
 hess_inv: <4x4 LbfgsInvHessProduct with dtype=float64>


plt.errorbar(Rdata, valuedata, sigmadata, fmt='.')
plt.plot(rax, broken_exponential(rax, bias30fit_results.x))
plt.yscale('log')


print(f'True: {trueparms}')
print(f'Fit: {bias30fit_results.x}')

True: [1.  0.7 2.  2. ]
Fit: [1.06237162 0.69414431 1.97754289 1.8709887 ]


lin_x = 0.
log_x = 1.
ul_x = 2.
ll_x = 3.
b12_x = 4.
b20_x = 5.
b30_x = 6.
dx = 0.05
colors = ['red','blue','green','black']


for (x, fit) in zip([lin_x,log_x,ul_x,ll_x,b12_x,b20_x,b30_x], [linfit_results, logfit_results, upfit_results, loglinfit_results, \
                                                               bias12fit_results, bias20fit_results, bias30fit_results]):
    if x==0.:
        labels = ['A','a','b','$R_0$']
    else:
        labels = [None,None,None,None]
        
    for i in range(4):
        plt.plot(x + i*dx, (fit.x/trueparms)[i], 'x', color=colors[i], label=labels[i])
plt.axhline(y=1., color='gray', linestyle='dashed')

plt.xticks(np.arange(7)+1.5*dx, ['Lin','Log','UpLim','LogLin','Bias1.2','Bias2','Bias3'])
plt.ylabel('Fit / True')
plt.legend(loc='best')

<matplotlib.legend.Legend at 0x12a3a8a00>

Least-squares fitting in log space with negative values due to background subtraction and noise¶

Derivation of least squares from maximum likelihood¶

Modification for negative data points¶

Final procedure¶

What does this term look like?¶

Alternative procedure: log when possible, linear when negative¶

Bias¶

Test case¶

Test 1: Linear fit¶

Test 2: Log fit ignoring negative points¶

Test 3: Upper limit term¶

Test 4: Log where possible, linear when negative¶

Test 5: Bias¶

Comparison¶