Digamos, por exemplo, que você esteja criando um modelo linear, mas os dados são complexos.
Meu conjunto de dados é complexo, pois todos os números em têm a forma ( a + b i ) . Existe algo processualmente diferente ao trabalhar com esses dados?
Eu pergunto porque, você acabará recebendo matrizes de covariância complexas e estatísticas de teste com valores complexos.
Você precisa usar um transposto conjugado em vez de transposto ao fazer menos quadrados? uma covariância complexa com valor é significativa?
Respostas:
Sumário
A generalização da regressão dos mínimos quadrados para variáveis de valor complexo é direta, consistindo principalmente na substituição de transposições de matriz por transpostas de conjugado nas fórmulas usuais de matriz. Uma regressão de valor complexo, no entanto, corresponde a uma regressão múltipla multivariada complicada cuja solução seria muito mais difícil de obter usando métodos padrão (variáveis reais). Assim, quando o modelo de valor complexo é significativo, é altamente recomendável usar aritmética complexa para obter uma solução. Esta resposta também inclui algumas maneiras sugeridas de exibir os dados e apresentar gráficos de diagnóstico do ajuste.
Para simplificar, vamos discutir o caso da regressão ordinária (univariada), que pode ser escrita
Tomei a liberdade de nomear a variável independente e a variável dependente Z , que é convencional (veja, por exemplo, Lars Ahlfors, Complex Analysis ). Tudo o que se segue é simples de se estender à configuração de regressão múltipla.W Z
Interpretação
Este modelo tem uma interpretação geométrica facilmente visualizada: a multiplicação por irá redimensionar w j pelo módulo de β 1 e girá- lo em torno da origem pelo argumento de β 1 . Posteriormente, adicionar β 0 traduz o resultado por esse valor. O efeito de ε j é "tremer" essa tradução um pouco. Assim, a regredir o z j na w j desta maneira é um esforço para compreender a recolha de pontos em 2D ( z j )β1 Wj β1 β1 β0 0 εj zj Wj ( zj) como resultante de uma constelação de pontos 2D por meio de uma tal transformação, permitindo algum erro no processo. Isso é ilustrado abaixo com a figura intitulada "Ajustar como transformação".( wj)
Observe que o redimensionamento e a rotação não são apenas transformações lineares do plano: elas excluem transformações inclinadas, por exemplo. Portanto, esse modelo não é o mesmo que uma regressão múltipla bivariada com quatro parâmetros.
Mínimos Quadrados Ordinários
Para conectar o caso complexo ao caso real, vamos escrever
para os valores da variável dependente ezj= xj+ i yj
para os valores da variável independente.Wj= uj+ i vj
Além disso, para os parâmetros escreva
e β 1 = γ 1 + i δ 1 .β0 0= γ0 0+ i δ0 0 β1= γ1+ i δ1
Todos os novos termos introduzidos são, obviamente, reais, e é imaginário enquanto j = 1 , 2 , … , n indexa os dados.i2=−1 j=1,2,…,n
MQO achados p 0 e β 1 que minimizam a soma dos quadrados dos desvios,β^0 β^1
Formalmente, isso é idêntico à formulação usual da matriz: compare com A única diferença que encontramos é que a transposição da matriz de projeto X ′ é substituída pela transposta conjugada X ∗ = ˉ X ′ . Consequentemente, a solução formal de matriz é(z−Xβ)′(z−Xβ). X′ X∗=X¯′
Ao mesmo tempo, para ver o que pode ser conseguido ao converter isso em um problema de variável puramente real, podemos escrever o objetivo do OLS em termos dos componentes reais:
Essa análise torna aparente que reescrever a regressão complexa em termos das partes reais (1) complica as fórmulas, (2) obscurece a interpretação geométrica simples e (3) exigiria uma regressão múltipla multivariada generalizada (com correlações não triviais entre as variáveis ) resolver. Nós podemos fazer melhor.
Exemplo
Será sempre o caso de que a interceptação somente real concorda com a parte real da interceptação complexa e a interceptação somente imaginária concorda com a parte imaginária da interceptação complexa. É aparente, no entanto, que as inclinações reais e imaginárias não concordam com os coeficientes de inclinação complexos nem entre si, exatamente como previsto.
Esses resultados, os gráficos e os diagnósticos sugerem que a fórmula de regressão complexa funciona corretamente e alcança algo diferente de regressões lineares separadas das partes real e imaginária das variáveis.
Código
R
fonte
zapsmall
inR
). Caso contrário, é um sinal de que algo está fundamentalmente errado.Após uma longa e agradável pesquisa no google, encontrei algumas informações relevantes sobre como entender o problema de uma maneira alternativa. Acontece que problemas semelhantes são comuns no processamento estatístico de sinais. Em vez de começar com uma probabilidade gaussiana que corresponde a mínimos quadrados lineares para dados reais, começa-se com a:
http://en.wikipedia.org/wiki/Complex_normal_distribution
Esta página da Wikipedia fornece um resumo satisfatório sobre esse objeto.
Outra fonte que encontrei que chega à mesma conclusão que o whuber, mas explora outros estimadores como a probabilidade máxima é: "Estimativas dos modelos de regressão linear inadequada", de Yan et al.
fonte
Embora o @whuber tenha uma resposta bem ilustrada e bem explicada, acho que é um modelo simplificado que perde parte do poder do espaço complexo.
Sugiro que a regressão linear complexa seja definida da seguinte forma:
Existem duas grandes diferenças.
Voltando ao modelo real, a solução ordinária de mínimos quadrados sai minimizando a perda, que é a probabilidade logarítmica negativa. Para uma distribuição normal, esta é a parábola:
Aqui está uma imagem da densidade de uma distribuição normal complexa:
Isso complica a regressão, embora eu tenha certeza de que a solução ainda é analítica. Eu o resolvi para o caso de uma entrada e estou feliz em transcrever minha solução aqui, mas tenho a sensação de que o whuber pode resolver o caso geral.
fonte
Esse problema surgiu novamente no Mathematica StackExchange e minha resposta / comentário extenso é que a resposta excelente do @whuber deve ser seguida.
Minha resposta aqui é uma tentativa de estender a resposta do @whuber um pouco, tornando a estrutura do erro um pouco mais explícita. O estimador de mínimos quadrados proposto é o que se usaria se a distribuição de erro bivariada tivesse uma correlação zero entre os componentes reais e imaginários. (Mas os dados gerados têm uma correlação de erro de 0,8.)
O que quero dizer com tudo isso é que o modelo que está sendo ajustado precisa ser completamente explícito e que os programas de álgebra simbólica podem ajudar a aliviar a confusão. (E, é claro, os estimadores de probabilidade máxima assumem uma distribuição normal bivariada que os estimadores de mínimos quadrados não assumem.)
Apêndice: O código completo do Mathematica
fonte