Como a interpolação está relacionada ao conceito de regressão?

17

Explique brevemente O que se entende por interpolação. Como isso está relacionado ao conceito de regressão?

interpolação é arte de ler nas entrelinhas de uma tabela e, em matemática elementar, o termo geralmente denota o processo de calcular os valores intermediários de uma função a partir de um conjunto de valores dados ou tabulares dessa função.

Não posso dar a resposta da segunda pergunta. Por favor ajude

Argha
fonte
4
A regressão visa identificar uma função para descrever o valor esperado de (a variável dependente) dado X (as variáveis ​​independentes). A interpolação utiliza regressão para prever o valor de Y em valores dados de X . A diferença é sutil, mas vem à tona nos modelos em que os Ys estão correlacionados, porque os valores previstos normalmente diferem dos valores de regressão. Nem a regressão nem a previsão se aplicam diretamente à interpolação em tabelas matemáticas, que geralmente se supõe não ter erro aleatório, mas seus algoritmos ainda podem ser usados. YXYXY
whuber
2
Isso funciona para alguma aula?
Glen_b -Reinstala Monica 4/07

Respostas:

23

A principal diferença entre interpolação e regressão é a definição do problema que eles resolvem.

Dados pontos de dados, quando você interpola, procura uma função que tenha alguma forma predefinida que tenha os valores nesses pontos exatamente como especificado. Isso significa que, dado pares ( x i , y i ), você procura F de alguma forma predefinida que satisfaça F ( x i ) = y i . Eu acho que mais comumente Fn(xEu,yEu)FF(xEu)=yEuF é escolhido para ser polinomial, spline (polinômios de baixo grau em intervalos entre os pontos indicados).

Ao fazer a regressão, você procura uma função que minimize algum custo, geralmente a soma dos quadrados dos erros. Você não precisa que a função tenha os valores exatos em determinados pontos, apenas deseja uma boa aproximação. Em geral, a função encontrada pode não satisfazer F ( x i ) = y i para qualquer ponto de dados, mas a função de custo, ou seja, n i = 1 ( F ( x i ) - y i ) 2FF(xEu)=yEuEu=1n(F(xEu)-yEu)2 será a menor possível de todas as funções de determinada forma.

Um bom exemplo de por que você pode querer aproximar apenas em vez de interpolar são os preços no mercado de ações. Você pode obter preços em algumas unidades de tempo recentes e tentar interpolar-los para obter uma previsão do preço na próxima unidade de tempo. Essa é uma péssima idéia, porque não há razão para pensar que as relações entre os preços possam ser exatamente expressas por um polinômio. Mas a regressão linear pode funcionar, já que os preços podem ter alguma "inclinação" e uma função linear pode ser uma boa aproximação, pelo menos localmente (dica: não é tão fácil, mas a regressão é definitivamente uma idéia melhor do que a interpolação neste caso )k

sjm.majewski
fonte
YX
O exemplo que você descreveu não seria extrapolação e não interpolação?
bi_scholar 18/02/19
6

As duas respostas anteriores explicaram a relação entre interpolação linear e regressão linear (ou mesmo interpolação geral e regressão polinomial). Mas uma conexão importante é que, depois de ajustar um modelo de regressão, você pode usá-lo para interpolar entre os pontos de dados fornecidos.

Michael R. Chernick
fonte
Então, quando eu regredir, digamos, altura em relação ao gênero, posso interpolar para encontrar a altura esperada de um meio homem, meio mulher! Este exemplo fantástico destaca a falha básica nessa resposta, que é a suposição de que todos os regressores em um modelo de regressão devem ser variáveis ​​contínuas.
whuber
2
A minha resposta se aplica quando todas as variáveis preditivas são contínuas ..
Michael R. Chernick
4

Espero que isso aconteça rapidamente com um exemplo e visualização simples.

Suponha que você tenha os seguintes dados:

X  Y
1  6
10 15
20 25
30 35
40 45
50 55

Podemos usar a regressão para modelar Y como uma resposta a X. Usando R: lm(y ~ x)

Os resultados são uma interceptação de 5 e um coeficiente para x de 1. O que significa que um Y arbitrário pode ser calculado para um dado X como X + 5. Como uma figura, você pode ver isso desta maneira:

insira a descrição da imagem aqui

Observe como se você foi ao eixo X, em qualquer lugar ao longo dele, desenhou uma linha até a linha ajustada e depois desenhou uma linha no eixo Y, você pode obter um valor, independentemente de eu ter fornecido ou não um ponto de valor para Y. A regressão está suavizando áreas sem dados, estimando o relacionamento subjacente.

Fomite
fonte
2

a diferença básica entre interpolação e regressão é a seguinte: Interpolação: suponha que haja n pontos (por exemplo: 10 pontos de dados); na interpolação, ajustaremos a curva que passa por todos os pontos de dados (ou seja, aqui 10 pontos de dados) com um grau do polinômio (número de pontos de dados -1; ie aqui é 9). onde, na regressão, nem todos os dados apontam apenas um conjunto deles necessários para o ajuste da curva.

geralmente a ordem da interpolação e regressão será (1,2 ou 3) se a ordem for maior que 3, mais oscilações serão vistas na curva.

user30339
fonte
2
Isto implica que a interpolação é baseada em polinômios, mas existem vários outros métodos, como a spline cúbica, seccionalmente cúbica Hermite, vizinho mais próximo, etc.
Nick Cox
@ Nick Embora você esteja correto, é curioso que todo método que você nomeie seja baseado em polinômios! Talvez o interpolador não polinomial mais simples e mais conhecido seja o peso de distância inversa (IDW).
whuber
@whuber Concordou; se polinómios pode ser aplicada com limitações, em seguida, a maioria dos métodos qualificar, por exemplo, vizinho = constante mais próxima seccionalmente, etc
Nick Cox
2

Regressão é o processo de encontrar a linha de melhor ajuste [1]. Interpolação é o processo de usar a linha de melhor ajuste para estimar o valor de uma variável a partir do valor de outra, desde que o valor que você esteja usando esteja dentro do intervalo de seus dados. Se estiver fora do intervalo, você usaria Extrapolação [1].

[1] http://mathhelpforum.com/advanced-applied-math/182558-interpolation-vs-regression.html

Razan Paul
fonte
2
Esta resposta não distingue interpolação de extrapolação. Você sustenta que eles são a mesma coisa? BTW, fóruns de matemática (e até livros e documentos, geralmente) geralmente não são boas fontes de informação sobre questões estatísticas, porque tendem a se concentrar em significados matemáticos estreitos que - embora corretos e úteis em aplicações puramente matemáticas - podem não se aplicar mais amplamente .
whuber
1

Com a interpolação ou ajuste de spline, obtemos dados numéricos (aposta interpolada entre cada par de dados originais) de tamanho maior, que, quando plotados, geram o efeito de uma curva suave. Na realidade, entre cada par de dados originais, um polinômio diferente é ajustado; portanto, toda a curva após a interpolação é uma curva contínua em partes, em que cada peça é formada por um polinômio diferente.

Se alguém estiver procurando por representação paramétrica dos dados numéricos originais, a regressão deve ser feita. Você também pode tentar ajustar um polinômio de alto grau ao spline. De qualquer forma, a representação será uma aproximação. Você também pode verificar a precisão da aproximação.

Karnika
fonte
Parece que você ainda não teve a chance de ler o comentário de Nick Cox , que aponta que nem todos os interpoladores são polinômios (locais).
whuber
0

A regressão e a interpolação são usadas para prever valores de uma variável (Y) para um determinado valor de outra variável (X). Em Regressão, podemos prever qualquer valor da variável dependente (Y) para um determinado valor da variável independente (X) Mesmo que esteja fora do intervalo de valores tabulados. Mas, no caso de Interpolação, só podemos prever os valores da variável dependente (Y) para um valor da variável independente (X) que está dentro da faixa dos valores fornecidos de X.

kounteyo roy chowdhury
fonte
0

Interpolação é o processo de ajustar vários pontos entre x = aex = b exatamente a um polinômio de interpolação. A interpolação pode ser usada para encontrar o valor aproximado (ou o valor ausente) de y no domínio x = [a, b] com maior precisão do que a técnica de regressão.

Por outro lado, a regressão é um processo de ajustar vários pontos a uma curva que passa pelos pontos ou perto dos pontos com um erro quadrado mínimo. A regressão não aproximará o valor de y no domínio x = [a, b] tão preciso quanto a interpolação, no entanto, a regressão fornece melhores previsões do que a interpolação para os valores de y no domínio entre x = (- infinito, a) ex = b, + infinito).

Em resumo, a interpolação fornece melhor precisão no valor de y no domínio de um intervalo x conhecido, enquanto a regressão fornece melhores previsões de y no domínio abaixo e além do intervalo conhecido de x.

NFM Noor
fonte
3
Não é uma definição de interpolação que um polinômio seja usado. Outras funções suaves podem ser apropriadas.
Nick Cox
3
Há outros problemas com suas reivindicações. Por exemplo, a regressão pode ser mais precisa que a interpolação. A distinção estatística entre os dois procedimentos é bem diferente do que você representa: veja os outros posts neste tópico.
whuber