Como posso verificar se dois sinais são normalmente distribuídos em conjunto?

10

Conforme explicado nesta página da Wikipedia , se duas variáveis ​​aleatórias X e Y não estiverem correlacionadas e normalmente forem distribuídas em conjunto, elas serão estatisticamente independentes.

Eu sei como verificar se X e Y estão correlacionados, mas não tenho idéia de como verificar se eles são distribuídos normalmente em conjunto. Eu mal conheço estatísticas (aprendi o que é uma distribuição normal há algumas semanas), então algumas respostas explicativas (e possivelmente alguns links para tutoriais) realmente ajudariam.

Portanto, minha pergunta é a seguinte: tendo dois sinais amostrados um número finito de N vezes, como posso verificar se as duas amostras de sinal são normalmente distribuídas em conjunto?

Por exemplo: as imagens abaixo mostram a distribuição conjunta estimada de dois sinais, s1 e s2, onde:

x=0.2:0.2:34;
s1 = x*sawtooth(x); %Sawtooth
s2 = randn(size(x,2)); %Gaussian

insira a descrição da imagem aqui insira a descrição da imagem aqui

O pdf conjunto foi estimado usando este 2D Kernel Density Estimator .

A partir das imagens, é fácil ver que o pdf da junta possui uma forma de colina centrada aproximadamente na origem. Eu acredito que isso é indicativo de que eles são de fato normalmente distribuídos em conjunto. No entanto, eu gostaria de uma maneira de verificar matematicamente. Existe algum tipo de fórmula que pode ser usada?

Obrigado.

Rachel
fonte
Esta é uma simulação na qual você começa com sinais que não são conjuntamente normais por construção , e seu procedimento estatístico parece estar mostrando que é possível confiar razoavelmente que os sinais são de fato normais em conjunto. Portanto, você deve verificar se (a) o método estatístico foi aplicável, aplicado corretamente ou interpretado corretamente, ou (b) seu método de geração de sinal está levando a sinais que são de fato conjuntamente normais, mesmo que um caso prima facie não possa ser feito para a normalidade conjunta (como seria o caso se s1 = randn(size(x,2));; s2 = randn(size(x,2));??
Dilip Sarwate
@DilipSarwate Isso seria (b). Quero uma maneira de verificar se a distribuição conjunta é de fato normal.
Rachel

Respostas:

6

Além do exame gráfico, você pode usar um teste de normalidade . Para dados bivariados, os testes de Mardia são uma boa escolha. Eles quantificam a forma de suas distribuições de duas maneiras diferentes. Se a forma parecer fora do normal, os testes fornecerão valores de p baixos.

As implementações do Matlab podem ser encontradas aqui .

MånsT
fonte
2

Este é mais um comentário extenso do que um esforço para melhorar a sugestão específica do @ MånsT: O teste estatístico, em geral, não é um teste para qual distribuição produziu dados, mas quais NÃO NÃO. Existem alguns testes que são "ajustados" para dar respostas à questão da normalidade: NÃO é de uma distribuição normal. O teste de Kolmogorov-Smirnov de uma amostra é bastante conhecido. O teste de Anderson Darling é talvez mais poderoso no caso one-D. Você deve se perguntar seriamente: POR QUE a resposta é importante? Muitas vezes, as pessoas fazem a pergunta para fins estatísticos errados. Seu exemplo demonstrou que seu teste do globo ocular gráfico tem baixa potência contra uma alternativa composta por uma alternativa dente de serra-Gaussiana, mas você não mostrou como essa falha afeta sua pergunta subjacente.

DWin
fonte
Nesse caso, a alternativa dente de serra-Gaussiana é de fato verdadeira, pois foi assim que os dados foram produzidos, mas o teste do globo ocular gráfico está sugerindo que o nulo (normal em conjunto) não deve ser rejeitado . A maioria dos estatísticos entende que a não rejeição do nulo não é o mesmo que a aceitação do nulo, mas o OP quer uma razão matemática para transformar a não rejeição do nulo em um abraço sincero do nulo como a verdade recebida (a verdade recebida). fatos sejam condenados).
precisa
Sim. O fato de sua tentativa de testar sua simulação não ter sido adequadamente rejeitada foi compreendido (como você comentou anteriormente). Como se deve abordar o problema da baixa potência para um método é central para o pensamento estatístico e não ficou claro que ele tenha uma compreensão firme do princípio subjacente. Mas não concluí que ele estava exigindo que um teste matemático ratificasse seu resultado no globo ocular.
Dwin
@DilipSarwate Se eu não puder provar que a distribuição conjunta é normal, gostaria de mostrar que há uma boa probabilidade de que ela de fato seja. Eu não sou um estatístico de nenhum trecho da imaginação, mas a não rejeição do nulo não seria pelo menos uma boa indicação?
Rachel
@DWin Talvez você esteja certo e eu não tenha entendido bem o princípio subjacente. Como eu disse, sou um novato em estatísticas! Eu sei que duas variáveis ​​podem de fato ser normalmente distribuídas em conjunto, e gostaria apenas de uma maneira de verificar se isso é verdade (pelo menos com um certo nível de confiança / probabilidade). E PS: apenas uma pequena nota - é ela, não ele.
Rachel
@ Rachel O que você está tentando "provar", viz. o fato de os dois sinais serem normais em conjunto é prima facie não é verdade, pois um foi gerado como sinal de dente de serra e o outro é ruído gaussiano. No entanto, você sente que elas são conjuntamente normais e que seu teste fornece motivos razoáveis ​​para essa crença. Como a Rainha Vermelha disse a Alice: "Às vezes eu acredito em até seis coisas impossíveis antes do café da manhã". Portanto, tenha certeza de que seu teste de gráficos / globo ocular realmente permite concluir com alguma confiança que os dois sinais são de fato conjuntamente normais e prosseguir imediatamente.
Dilip Sarwate 31/03