Estatisticamente significante vs. independente / dependente

9

Qual é a diferença entre ter algo estatisticamente significativo (como uma diferença entre duas amostras) e declarar se um grupo de números é independente ou dependente.

Elpezmuerto
fonte

Respostas:

9

A importância em um teste t de amostras independentes significa apenas que a probabilidade (se o nulo for verdadeiro) de amostrar uma diferença média tão extrema quanto a diferença média que você realmente amostrou é menor que 0,05.

Isso não tem nenhuma relação com dependente / independente. "Dependente" significa que a distribuição de algumas observações individuais está conectada à distribuição de outras; por exemplo, A) elas são a mesma pessoa fazendo o mesmo teste uma segunda vez, B) as pessoas de cada grupo são equiparadas a alguma variável de pré-teste, C) as pessoas nos dois grupos estão relacionadas (ou seja, família). "Independente" significa que não existe tal conexão.

Brian
fonte
11
Observando também que p = 0,05 é um limite um tanto arbitrário. Se você acha que 1:20 tem uma chance muito alta de um falso positivo, seu p deve ser menor.
naught101
9

Por que parar em t -Testes?

Você pode pensar em duas variáveis sendo não correlacionadas como dois vetores ortogonais, exatamente como os e yxy eixos em um dimensional sistema de coordenadas cartesianas dois.

Quando qualquer um dos dois vectores de, digamos e y está correlacionada com a outra, haverá uma determinada parte de x que pode ser projectadas no Y e vice-versa. Com isso em mente, é bastante fácil perceber que, uma vez que,xy

x,y=xycos(θ)x,yxy=cos(θ)=r

Onde é o coeficiente de correlação de Pearson e é o produto interno dos argumentos. Quando aprendi isso, fiquei totalmente impressionado com a geometria simples da idéia de correlação. E essa definitivamente não é a única maneira de medir a correlação entre duas (ou mais) variáveis., r,

O teste de significância é um jogo de bola diferente. Muitas vezes queremos saber em quanto medida dois (ou mais) grupos diferem em alguma variável de resultado como resultado de alguma manipulação que foi realizada nesses grupos. Como Brian disse, você quer saber se os dois grupos vêm da mesma distribuição e, assim, calcula a probabilidade de amostrar a diferença média (escalada pelo erro padrão da média) que obteve do seu experimento, considerando que a hipótese nula (não há diferença significativa nos meios) é verdadeira. Na pesquisa comportamental (e geralmente em outros lugares), se essa probabilidade for menor que 0,05, você pode concluir que a diferença entre os dois (ou mais) meios provavelmente se deve à sua manipulação.

Edição : Dilip Sarwate apontou que duas variáveis ​​não correlacionadas podem ser estatisticamente dependentes, então eu retirei a primeira parte. Obrigado por isso.

Phillip Cloud
fonte
Uau, meu histórico de matemática é muito mais avançado do que meu histórico de estatísticas. Acho que é uma maneira realmente intuitiva de entender o r de Pearson. Esta resposta é realmente útil, obrigado!
naught101
Especialmente o conceito de que covariância é apenas um produto interno!
naught101
2
-1 para "Você pode pensar em duas variáveis ​​independentes (às vezes também chamadas de não correlacionadas)" Independência não é o mesmo que não estar correlacionada; variáveis ​​aleatórias não correlacionadas podem ser muito dependentes.
precisa
OK, obrigado por corrigir o problema. Estou revertendo meu voto negativo.
Dilip Sarwate