Regressão múltipla em estatísticas direcionais / circulares?

9

Estou tentando desenvolver um modelo preditivo para uma variável dependente angular (em usando várias medidas independentes - também variáveis ​​angulares, em - como preditores. Cada preditor está significativamente, mas não extremamente, fortemente correlacionado com a variável dependente. Como posso combinar os preditores para determinar um modelo preditivo para a variável dependente que seja ideal em algum sentido? E como posso identificar rigorosamente os preditores mais fortes?[ 0 , 2 π ][0 0,2π])[0 0,2π]

Para variáveis ​​no (s) espaço (s) euclidiano (s), empregaria regressão múltipla (ou similar) e análise de componentes principais. Mas a periodicidade de todas as variáveis ​​interfere com essas abordagens, por exemplo, 0,02 deve ser altamente correlacionada com 6,26, mas não com 3,14. Como os procedimentos "usuais" são generalizados para estatísticas direcionais / circulares? Qualquer ideia ou citação de referências úteis seria útil. (Já conheço os textos de N. Fisher e Mardia & Jupp, mas não tenho acesso útil a eles.)

user44436
fonte

Respostas:

5

No livro que tenho, diz que apenas recentemente alguns trabalhos começaram a explorar a regressão multivariada, onde uma ou mais variáveis ​​são circulares. Eu mesmo não os verifiquei, mas fontes relevantes parecem ser:

Bhattacharya, S. e SenGupta, A. (2009). Análise bayesiana de modelos linear-circulares semiparamétricos. Jornal de Estatísticas Agrícolas, Biológicas e Ambientais , 14, 33-65.

Lund, U. (1999). Regressão da menor distância circular para dados direcionais. Jornal de Estatística Aplicada , 26, 723-733

Lund, U. (2002). Regressão baseada em árvore ou uma resposta circular. Comunicações em Estatística - Teoria e Métodos , 31, 1549-1560.

Qin, X., Zhang, J.-S. e Yan, X.-D. (2011). Um modelo de regressão multivariada circular-linear não paramétrico com um seletor de largura de banda de regra de ouro. Computadores e Matemática com Aplicações , 62, 3048-3055.


No caso de uma resposta circular, você tem apenas um único regressor circular (que eu entendo que não é o seu caso, mas talvez regressões separadas também sejam interessantes), existe uma maneira de estimar o modelo. [1] recomende a montagem do modelo linear geral

porque(Θj)=γ0 0c+k=1m(γckcporque(kψj)+γskcpecado(kψj))+ε1j,
pecado(Θj)=γ0 0s+k=1m(γcksporque(kψj)+γskspecado(kψj))+ε2j.

A coisa boa é que este modelo pode ser estimada utilizando a lm.circular função da biblioteca R circular .

[1] Jammalamadaka, SR e SenGupta, A. (2001). Tópicos em estatística circular . World Scientific, Singapura.

Julius Vainora
fonte
1

Você pode dar uma olhada nesses artigos que lidam com regressão múltipla quando a variável dependente é circular ou esférica. A abordagem é baseada na distribuição normal projetada.

Hernandez-Stumpfhauser, Daniel, F. Jay Breidt e Mark J. van der Woerd. "A distribuição normal geral projetada da dimensão arbitrária: modelagem e inferência bayesiana". Bayesian Analysis 12.1 (2017): 113-133.

Wang, Fangpo e Alan E. Gelfand. "Análise direcional de dados sob a distribuição normal geral projetada." Metodologia estatística 10.1 (2013): 113-127

Nuñez-Antonio, Gabriel, Eduardo Gutiérrez-Peña e Gabriel Escarela. "Um modelo de regressão bayesiano para dados circulares com base na distribuição normal projetada". Modelagem Estatística 11.3 (2011): 185-201.

Presnell, Brett, Scott P. Morrison e Ramon C. Littell. "Modelos lineares multivariados projetados para dados direcionais." Jornal da Associação Estatística Americana 93.443 (1998): 1068-1077.

Este último foi o primeiro a sair usando essa abordagem normal projetada

user160744
fonte