Suponha que temos dois pontos (a figura a seguir: círculos pretos) e queremos encontrar um valor para um terceiro ponto entre eles (cruz). De fato, vamos estimar isso com base em nossos resultados experimentais, os pontos negros. O caso mais simples é desenhar uma linha e depois encontrar o valor (isto é, interpolação linear). Se tivéssemos pontos de apoio, por exemplo, como pontos marrons nos dois lados, preferimos nos beneficiar deles e ajustar uma curva não linear (curva verde).
A questão é: qual é o raciocínio estatístico para marcar a cruz vermelha como a solução? Por que outras cruzes (por exemplo, amarelas) não são respostas onde poderiam estar? Que tipo de inferência ou (?) Nos leva a aceitar a vermelha?
Vou desenvolver minha pergunta original com base nas respostas obtidas para essa pergunta muito simples.
fonte
Respostas:
Qualquer forma de ajuste de função, mesmo que não paramétrica (que normalmente faz suposições sobre a suavidade da curva envolvida), envolve suposições e, portanto, um salto de fé.
A solução antiga de interpolação linear é aquela que 'simplesmente funciona' quando os dados que você possui são refinados 'o suficiente' (se você olhar para um círculo suficientemente próximo, ele também parece plano - basta perguntar a Columbus), e era possível até antes da era do computador (o que não é o caso de muitas soluções modernas de splines). Faz sentido assumir a crença de que a função 'continuará na mesma matéria (ou seja, linear)' entre os dois pontos, mas não há uma razão a priori para isso (exceto o conhecimento sobre os conceitos em questão).
Torna-se rapidamente claro quando você tem três (ou mais) pontos não colineares (como quando você adiciona os pontos marrons acima), que a interpolação linear entre cada um deles logo envolverá cantos afiados em cada um deles, o que normalmente é indesejável. É aí que as outras opções entram.
No entanto, sem um conhecimento adicional do domínio, não há como afirmar com certeza que uma solução é melhor que a outra (para isso, você precisaria saber qual é o valor dos outros pontos, derrotando o propósito de ajustar a função no primeiro lugar).
Pelo lado positivo, e talvez mais relevante para a sua pergunta, sob 'condições de regularidade' (leia-se: suposições : se sabemos que a função é, por exemplo, suave), a interpolação linear e as outras soluções populares podem ser consideradas 'razoáveis' aproximações. Ainda: requer suposições e, para elas, normalmente não temos estatísticas.
fonte
Você pode calcular a equação linear para a linha de melhor ajuste (por exemplo, y = 0,4554x + 0,7525), mas isso só funcionaria se houvesse um eixo rotulado. No entanto, isso não daria a resposta exata apenas a mais adequada em relação aos outros pontos.
fonte