Peço desculpas antecipadamente se esta pergunta for mal colocada: sou astrônomo, não estatístico. Minha pergunta tem como objetivo específico me ajudar a descobrir se os processos gaussianos são uma técnica apropriada para o meu problema.
Usando um telescópio e um espectrógrafo alimentado por fibra, meu projeto levou o espectro óptico de uma galáxia em muitos locais. O padrão de amostragem para um único apontador está na primeira imagem e é repetido três vezes no total, com diferentes deslocamentos espaciais, a fim de preencher as lacunas (segunda imagem). Idealmente, eu gostaria de construir estimativas de certas quantidades sobre uma grade que cobre a galáxia.
Meu método ingênuo seria analisar o espectro de cada fibra separadamente, para que eu tivesse de estimativas pontuais das quantidades de interesse e depois construísse um processo gaussiano para estimar essas quantidades em todos os lugares. Da mesma forma, eu poderia construir um processo gaussiano para os espectros, e depois analisar o GP na minha grade de escolha para encontrar as quantidades em que estou interessado. No entanto, não tenho certeza se essa é uma abordagem válida, já que minhas observações são não discretos, mas sim coincidentes.
Ao contrário, por exemplo, dos cientistas do solo, que podem coletar sujeira de um local muito discreto e depois se afastar 50 metros e repetir, minhas observações se sobrepõem espacialmente, então estou integrando toda a luz que uma galáxia emite. Não é óbvio para mim que eu poderia negligenciar qualquer variação espacial que possa existir dentro de uma determinada medida. Em outras palavras, um processo gaussiano é válido mesmo quando os locais de amostragem individuais não são pequenos? Posso construir em um termo espacial adicional para explicar a "mistura" leve em uma única fibra?
Adendo: Tradicionalmente, os espectros são apenas interpolados, reamostrados em uma grade e depois analisados, o que também me parece extremamente errado - mas se vou chover nos desfiles dos colegas, quero pelo menos apresentar um método alternativo.
fonte
Há um tópico em geoestatística chamado Exat Downscaling. O objetivo principal aqui é estimar uma propriedade em uma escala menor que as observações. Além disso, essas observações podem ou não se sobrepor (realmente não importa). Consulte este documento: http://www.ccgalberta.com/ccgresources/report07/2005-101-exact_reproduction.pdf
Neste artigo, eles mostram um método para reduzir a escala das observações usando técnicas geoestatísticas. Eles mostram que, calculando corretamente as covariâncias cruzadas entre diferentes escalas de dados (ponto versus bloco), a estimativa de krigagem ainda é válida; de modo que a média dos valores estimados em escala menor seja igual a dados de entrada maiores. Basicamente, para calcular os valores estimados em qualquer escala, você só precisa calcular a função de covariância entre os dados de entrada, escalas de destino e correlações cruzadas corretamente. No Processo Gaussiano, a suposição é de que a estimativa está sendo feita na mesma escala das observações de entrada.
Portanto, estas são as etapas: 1- Calcule o variograma experimental a partir dos seus dados.
2- Ajuste o modelo do variograma ao seu variograma experimental. Pode ser necessário considerar a anisotropia direcional aqui. Essa é a função de covariância que no GP é calculada pelo método de máxima verossimilhança.
3- Calcule todas as covariâncias e covariâncias cruzadas entre os dados de entrada e a escala de destino. Existem recibos numéricos para esta etapa. A idéia é que, discretizando os blocos em pontos finitos, é possível calcular a covariância média. Os dados de sobreposição devem ser levados em consideração aqui.
4- execute o Kriging e calcule os valores estimados.
GP é um tópico muito relacionado à geoestatística. No entanto, a geoestatística não se limita aos processos gaussianos. Existem muitos outros métodos para estimar ou simular um processo aleatório.
fonte