Explique brevemente O que se entende por interpolação. Como isso está relacionado ao conceito de regressão?
interpolação é arte de ler nas entrelinhas de uma tabela e, em matemática elementar, o termo geralmente denota o processo de calcular os valores intermediários de uma função a partir de um conjunto de valores dados ou tabulares dessa função.
Não posso dar a resposta da segunda pergunta. Por favor ajude
Respostas:
A principal diferença entre interpolação e regressão é a definição do problema que eles resolvem.
Dados pontos de dados, quando você interpola, procura uma função que tenha alguma forma predefinida que tenha os valores nesses pontos exatamente como especificado. Isso significa que, dado pares ( x i , y i ), você procura F de alguma forma predefinida que satisfaça F ( x i ) = y i . Eu acho que mais comumente Fn ( xEu, yEu) F F( xEu) = yEu F é escolhido para ser polinomial, spline (polinômios de baixo grau em intervalos entre os pontos indicados).
Ao fazer a regressão, você procura uma função que minimize algum custo, geralmente a soma dos quadrados dos erros. Você não precisa que a função tenha os valores exatos em determinados pontos, apenas deseja uma boa aproximação. Em geral, a função encontrada pode não satisfazer F ( x i ) = y i para qualquer ponto de dados, mas a função de custo, ou seja, ∑ n i = 1 ( F ( x i ) - y i ) 2F F( xEu) = yEu ∑ni = 1( F( xEu) - yEu)2 será a menor possível de todas as funções de determinada forma.
Um bom exemplo de por que você pode querer aproximar apenas em vez de interpolar são os preços no mercado de ações. Você pode obter preços em algumas unidades de tempo recentes e tentar interpolar-los para obter uma previsão do preço na próxima unidade de tempo. Essa é uma péssima idéia, porque não há razão para pensar que as relações entre os preços possam ser exatamente expressas por um polinômio. Mas a regressão linear pode funcionar, já que os preços podem ter alguma "inclinação" e uma função linear pode ser uma boa aproximação, pelo menos localmente (dica: não é tão fácil, mas a regressão é definitivamente uma idéia melhor do que a interpolação neste caso )k
fonte
As duas respostas anteriores explicaram a relação entre interpolação linear e regressão linear (ou mesmo interpolação geral e regressão polinomial). Mas uma conexão importante é que, depois de ajustar um modelo de regressão, você pode usá-lo para interpolar entre os pontos de dados fornecidos.
fonte
Espero que isso aconteça rapidamente com um exemplo e visualização simples.
Suponha que você tenha os seguintes dados:
Podemos usar a regressão para modelar Y como uma resposta a X. Usando R:
lm(y ~ x)
Os resultados são uma interceptação de 5 e um coeficiente para x de 1. O que significa que um Y arbitrário pode ser calculado para um dado X como X + 5. Como uma figura, você pode ver isso desta maneira:
Observe como se você foi ao eixo X, em qualquer lugar ao longo dele, desenhou uma linha até a linha ajustada e depois desenhou uma linha no eixo Y, você pode obter um valor, independentemente de eu ter fornecido ou não um ponto de valor para Y. A regressão está suavizando áreas sem dados, estimando o relacionamento subjacente.
fonte
a diferença básica entre interpolação e regressão é a seguinte: Interpolação: suponha que haja n pontos (por exemplo: 10 pontos de dados); na interpolação, ajustaremos a curva que passa por todos os pontos de dados (ou seja, aqui 10 pontos de dados) com um grau do polinômio (número de pontos de dados -1; ie aqui é 9). onde, na regressão, nem todos os dados apontam apenas um conjunto deles necessários para o ajuste da curva.
geralmente a ordem da interpolação e regressão será (1,2 ou 3) se a ordem for maior que 3, mais oscilações serão vistas na curva.
fonte
Regressão é o processo de encontrar a linha de melhor ajuste [1]. Interpolação é o processo de usar a linha de melhor ajuste para estimar o valor de uma variável a partir do valor de outra, desde que o valor que você esteja usando esteja dentro do intervalo de seus dados. Se estiver fora do intervalo, você usaria Extrapolação [1].
[1] http://mathhelpforum.com/advanced-applied-math/182558-interpolation-vs-regression.html
fonte
Com a interpolação ou ajuste de spline, obtemos dados numéricos (aposta interpolada entre cada par de dados originais) de tamanho maior, que, quando plotados, geram o efeito de uma curva suave. Na realidade, entre cada par de dados originais, um polinômio diferente é ajustado; portanto, toda a curva após a interpolação é uma curva contínua em partes, em que cada peça é formada por um polinômio diferente.
Se alguém estiver procurando por representação paramétrica dos dados numéricos originais, a regressão deve ser feita. Você também pode tentar ajustar um polinômio de alto grau ao spline. De qualquer forma, a representação será uma aproximação. Você também pode verificar a precisão da aproximação.
fonte
A regressão e a interpolação são usadas para prever valores de uma variável (Y) para um determinado valor de outra variável (X). Em Regressão, podemos prever qualquer valor da variável dependente (Y) para um determinado valor da variável independente (X) Mesmo que esteja fora do intervalo de valores tabulados. Mas, no caso de Interpolação, só podemos prever os valores da variável dependente (Y) para um valor da variável independente (X) que está dentro da faixa dos valores fornecidos de X.
fonte
Interpolação é o processo de ajustar vários pontos entre x = aex = b exatamente a um polinômio de interpolação. A interpolação pode ser usada para encontrar o valor aproximado (ou o valor ausente) de y no domínio x = [a, b] com maior precisão do que a técnica de regressão.
Por outro lado, a regressão é um processo de ajustar vários pontos a uma curva que passa pelos pontos ou perto dos pontos com um erro quadrado mínimo. A regressão não aproximará o valor de y no domínio x = [a, b] tão preciso quanto a interpolação, no entanto, a regressão fornece melhores previsões do que a interpolação para os valores de y no domínio entre x = (- infinito, a) ex = b, + infinito).
Em resumo, a interpolação fornece melhor precisão no valor de y no domínio de um intervalo x conhecido, enquanto a regressão fornece melhores previsões de y no domínio abaixo e além do intervalo conhecido de x.
fonte