Preciso resolver um problema complicado de regressão no disco da unidade. A pergunta original atraiu alguns comentários interessantes, mas infelizmente nenhuma resposta. Enquanto isso, aprendi algo mais sobre esse problema, portanto tentarei dividir o problema original em subproblemas e verifico se desta vez tenho mais sorte.
Tenho 40 sensores de temperatura regularmente espaçados em um anel estreito dentro do disco da unidade:
Esses sensores adquirem temperatura no tempo. No entanto, como a variação do tempo é muito menor que a variação do espaço, vamos simplificar o problema ignorando a variabilidade do tempo e supor que cada sensor me dê apenas uma média de tempo. Isso significa que tenho 40 amostras (uma para cada sensor) e não tenho amostras repetidas.
Gostaria de construir uma superfície de regressão partir dos dados do sensor. A regressão tem dois objetivos:
- Preciso estimar um perfil médio de temperatura radial . Com a regressão linear, eu já estimo uma superfície que é a superfície média da temperatura, portanto, só preciso integrar minha superfície em relação a , certo? Se eu usar polinômios para regressão, essa etapa deve ser um pedaço de bolo.θ
- Preciso estimar um perfil de temperatura radial , de modo que, em cada posição radial, .P ( T ( ρ ) < T 95 ( ρ ) ) = 0,95
Dados esses dois objetivos, qual técnica devo usar para a regressão no disco da unidade? Obviamente, os Processos Gaussianos são comumente usados para regressão espacial. No entanto, a definição de um bom kernel para o disco da unidade não é trivial, portanto, gostaria de manter as coisas simples e usar polinômios, a menos que você sinta que é uma estratégia perdida. Eu li sobre os polinômios da Zernike . Os polinômios de Zernike parecem ser apropriados para a regressão sobre o disco da unidade, pois são periódicos em .
Depois que o modelo é escolhido, preciso escolher um procedimento de estimativa. Como esse é um problema de regressão espacial, erros em locais diferentes devem ser correlacionados. Os Mínimos Quadrados Ordinários assumem erros não correlacionados, portanto, acho que Mínimos Quadrados Generalizados seriam mais apropriados. O GLS parece uma técnica estatística relativamente comum, uma vez que existe uma gls
função na distribuição R padrão. No entanto, nunca usei o GLS e tenho dúvidas. Por exemplo, como faço para estimar a matriz de covariância? Um exemplo elaborado, mesmo com apenas alguns sensores, seria ótimo.
PS: Eu escolhi usar os polinômios Zernike e o GLS, porque me parece a coisa lógica a fazer aqui. No entanto, não sou especialista e, se você achar que estou indo na direção errada, fique à vontade para usar uma abordagem completamente diferente.
fonte
Respostas:
Acho que você está no caminho certo ao pensar em algo como os polinômios de Zernike. Como observado na resposta de jwimberly, estes são um exemplo de um sistema de funções de base ortogonal em um disco. Não estou familiarizado com os polinômios de Zernike, mas muitas outras famílias de funções ortogonais (incluindo funções de Bessel) surgem naturalmente na física matemática clássica como funções próprias para certas equações diferenciais parciais (no momento da redação deste artigo, a animação no topo desse link ainda mostra um exemplo de uma cabeça de tambor vibratória).
Duas perguntas me vêm à mente. Primeiro, se tudo o que você procura é o perfil radial ( média), então de quantas restrições você precisa no padrão espacial? Segundo, que tipos de variabilidade ocorrem nos dados espaço-temporais?θ
Em termos da primeira pergunta, há duas preocupações que vêm à mente. Devido às coordenadas polares, a área de suporte para cada sensor tem uma tendência com . A segunda preocupação seria a possibilidade de criar aliases , essencialmente um desalinhamento de seus sensores em relação à fase do padrão (para usar uma analogia de Fourier / Bessel). Observe que o aliasing provavelmente será a principal incerteza na restrição das temperaturas de pico (por exemplo, ).T 95r T95
Em termos dessa segunda pergunta, a variabilidade dos dados pode realmente ajudar com quaisquer problemas de alias, permitindo essencialmente que qualquer desalinhamento seja calculado sobre as diferentes medidas. (Supondo que não haja viés sistemático ... mas isso seria um problema para qualquer método, sem, por exemplo, um modelo físico para fornecer mais informações).
Portanto, uma possibilidade seria definir suas funções ortogonais espaciais puramente nos locais dos sensores. Essas "funções ortogonais empíricas" podem ser calculadas via PCA em sua matriz de dados espaço-temporais. (Possivelmente, você poderia usar um pouco de ponderação para explicar as áreas variáveis de suporte do sensor, mas, dada a grade polar uniforme e o objetivo das médias radiais, isso pode não ser necessário.)
Note-se que se não é quaisquer dados de modelagem física disponíveis para variações "esperado" na temperatura, disponíveis em uma grade computacional spatiotemporal densa, em seguida, o mesmo procedimento PCA poderia ser aplicada para que dados para funções ortogonais derivam. (Isso normalmente seria chamado de " Decomposição Ortogonal Adequada " em engenharia, onde é usado para redução de modelo, por exemplo, um modelo de dinâmica de fluidos computacional caro pode ser destilado para uso em outras atividades de projeto.)
Um comentário final, se você ponderar os dados do sensor por área de suporte (por exemplo, tamanho da célula polar), esse seria um tipo de covariância diagonal, no âmbito do GLS . (Isso se aplicaria mais ao seu problema de previsão, embora o PCA ponderado estivesse intimamente relacionado.)
Eu espero que isso ajude!
Atualização: Seu novo diagrama de distribuição de sensores muda consideravelmente as coisas na minha opinião. Se você deseja estimar as temperaturas no interior do disco, precisará de muito mais informações antes do que simplesmente "conjunto de funções ortogonais no disco da unidade". Há pouca informação nos dados do sensor.
Se você realmente deseja estimar a variação da temperatura espacial sobre o disco, a única maneira razoável que eu posso ver seria tratar o problema como um processo de assimilação de dados . Aqui você precisaria, pelo menos, restringir a forma paramétrica da distribuição espacial com base em algumas considerações baseadas em física (elas podem ser de simulações ou de dados relacionados em sistemas com dinâmica semelhante).
Eu não sei a sua aplicação particular, mas se for algo como isso , então eu imagino que há uma extensa literatura de engenharia que você pode desenhar em cima de escolher restrições prévias apropriadas. (Para esse tipo de conhecimento detalhado do domínio, este provavelmente não é o melhor site para o StackExchange.)
fonte
Os polinômios Zernlike não soar como uma má escolha, uma vez que eles já têm e dependência e ortogonalidade cozido. No entanto, desde que você está estudando temperatura, uma escolha sem dúvida mais apropriado e mais conhecido seriam as funções de Bessel . Eles surgem no estudo do fluxo de calor em objetos cilíndricos / sistemas de coordenadas, e, portanto, há uma chance de que eles sejam fisicamente mais apropriados. A n-ésima função de Bessel daria a dependência radial associada a uma função trigonométrica correspondente para a dependência polar; você pode encontrar os detalhes em muitos livros de física e PDE.θr θ
fonte