Conforme explicado nesta página da Wikipedia , se duas variáveis aleatórias X e Y não estiverem correlacionadas e normalmente forem distribuídas em conjunto, elas serão estatisticamente independentes.
Eu sei como verificar se X e Y estão correlacionados, mas não tenho idéia de como verificar se eles são distribuídos normalmente em conjunto. Eu mal conheço estatísticas (aprendi o que é uma distribuição normal há algumas semanas), então algumas respostas explicativas (e possivelmente alguns links para tutoriais) realmente ajudariam.
Portanto, minha pergunta é a seguinte: tendo dois sinais amostrados um número finito de N vezes, como posso verificar se as duas amostras de sinal são normalmente distribuídas em conjunto?
Por exemplo: as imagens abaixo mostram a distribuição conjunta estimada de dois sinais, s1 e s2, onde:
x=0.2:0.2:34;
s1 = x*sawtooth(x); %Sawtooth
s2 = randn(size(x,2)); %Gaussian
O pdf conjunto foi estimado usando este 2D Kernel Density Estimator .
A partir das imagens, é fácil ver que o pdf da junta possui uma forma de colina centrada aproximadamente na origem. Eu acredito que isso é indicativo de que eles são de fato normalmente distribuídos em conjunto. No entanto, eu gostaria de uma maneira de verificar matematicamente. Existe algum tipo de fórmula que pode ser usada?
Obrigado.
s1 = randn(size(x,2));; s2 = randn(size(x,2));
??Respostas:
Além do exame gráfico, você pode usar um teste de normalidade . Para dados bivariados, os testes de Mardia são uma boa escolha. Eles quantificam a forma de suas distribuições de duas maneiras diferentes. Se a forma parecer fora do normal, os testes fornecerão valores de p baixos.
As implementações do Matlab podem ser encontradas aqui .
fonte
Este é mais um comentário extenso do que um esforço para melhorar a sugestão específica do @ MånsT: O teste estatístico, em geral, não é um teste para qual distribuição produziu dados, mas quais NÃO NÃO. Existem alguns testes que são "ajustados" para dar respostas à questão da normalidade: NÃO é de uma distribuição normal. O teste de Kolmogorov-Smirnov de uma amostra é bastante conhecido. O teste de Anderson Darling é talvez mais poderoso no caso one-D. Você deve se perguntar seriamente: POR QUE a resposta é importante? Muitas vezes, as pessoas fazem a pergunta para fins estatísticos errados. Seu exemplo demonstrou que seu teste do globo ocular gráfico tem baixa potência contra uma alternativa composta por uma alternativa dente de serra-Gaussiana, mas você não mostrou como essa falha afeta sua pergunta subjacente.
fonte