Quais são as vantagens / desvantagens do uso de splines, splines suavizadas e emuladores de processos gaussianos?

Estou interessado em aprender (e implementar) uma alternativa à interpolação polinomial.

No entanto, estou tendo problemas para encontrar uma boa descrição de como esses métodos funcionam, como eles se relacionam e como eles se comparam.

Agradecemos sua opinião sobre os prós / contras / condições sob as quais esses métodos ou alternativas seriam úteis, mas algumas boas referências a textos, slides ou podcasts seriam suficientes.

interpolation splines David LeBauer
fonte

Isso é realmente uma pergunta muito interessante, mas talvez (apenas talvez) mais apropriada para math.stackexchange.com ?

Steffen

Há algum material sobre splines e suavização de splines em The Elements of Statistical Learning por Hastie et al.

NPE

Eu acho que essa é uma pergunta perfeitamente razoável sobre estatística de computação.

precisa saber é o seguinte

@csgillespie: Tudo o que sei sobre splines e interpolação que aprendi em aulas numéricas / de matemática. Por isso, posso ser um pouco tendencioso;).

steffen

A regressão básica do OLS é uma técnica muito boa para ajustar uma função a um conjunto de dados. No entanto, regressão simples só se encaixa uma linha reta que é constante para toda a gama possível de . Isso pode não ser apropriado para uma determinada situação. Por exemplo, os dados às vezes mostram um relacionamento curvilíneo . Isso pode ser tratado por meio da regressão de em uma transformação de , . Diferentes transformações são possíveis. Nas situações em que a relação entre e é monotônica , mas diminui continuamente, uma transformação de log $X$ $Y$ $X$ $f(X)$ $X$ $Y$ pode ser usado. Outra opção popular é usar um polinômio em que novos termos são formados elevando a uma série de potências (por exemplo, , , etc.). Essa estratégia é fácil de implementar e você pode interpretar o ajuste informando quantas 'dobras' existem nos seus dados (onde o número de dobras é igual à maior potência necessária menos 1). $X$ $X^2$ $X^3$

No entanto, regressões baseadas no logaritmo ou em um expoente da covariável se ajustarão de maneira ideal apenas quando essa for a natureza exata do verdadeiro relacionamento. É bastante razoável imaginar que exista uma relação curvilínea entre e que seja diferente das possibilidades que essas transformações oferecem. Assim, chegamos a duas outras estratégias. A primeira abordagem é loess , uma série de regressões lineares ponderadas calculadas sobre uma janela em movimento. Essa abordagem é mais antiga e mais adequada para a análise exploratória de dados . $X$ $Y$

A outra abordagem é usar splines. Em que é mais simples, uma spline é um novo termo que se aplica a apenas uma parte da gama de . Por exemplo, pode variar de 0 a 1, e o termo spline pode variar de 0,7 a 1. Nesse caso, 0,7 é o nó . Um termo spline simples e linear seria calculado da seguinte forma: $X$ $X$ e seria adicionado ao seu modelo,alémdotermooriginal. O modelo ajustado mostrará uma quebra acentuada em 0,7 com uma linha reta de 0 a 0,7, e a linha continuando com uma inclinação diferente de 0,7 a 1. No entanto, um termo de spline não precisa ser linear. Especificamente, foi determinado que splines cúbicos são especialmente úteis (ou seja,

X_{s p eu Eu n e} = {\begin{cases} 0 0 & E se X \leq .7 \\ X - .7 & E se X > .7 \end{cases}

$X_{\rm spline} = \begin{cases} 0\quad &\text{if } X\le{.7} \\ X-.7\quad &\text{if } X>.7 \end{cases}$

X

$X$

X_{s p l i n e}^{3}

$X_{\rm spline}^3$ ) A quebra acentuada não precisa estar lá também. Foram desenvolvidos algoritmos que restringem os parâmetros ajustados, de modo que a primeira e a segunda derivadas correspondam aos nós, o que torna impossível a detecção dos nós na saída. O resultado final de tudo isso é que, com apenas alguns nós (geralmente 3-5) nos locais de escolha (que o software pode determinar para você), é possível reproduzir praticamente qualquercurva. Além disso, os graus de liberdade são calculados corretamente, para que você possa confiar nos resultados, o que não é verdade quando você olha primeiro para seus dados e depois decide ajustar um termo ao quadrado porque viu uma dobra. Além disso, tudo isso é apenas outra versão (embora mais complicada) do modelo linear básico. Assim, tudo o que obtemos com modelos lineares vem com isso (por exemplo, previsões, resíduos, faixas de confiança, testes etc.) Essas são vantagens substanciais .

A introdução mais simples a esses tópicos que eu conheço é:

Fox, J. (2000). Regressão simples não paramétrica: gráficos de dispersão de suavização , Sage.

- Reinstate Monica
fonte

Quais são as vantagens / desvantagens do uso de splines, splines suavizadas e emuladores de processos gaussianos?

Respostas: