Ao estudar duas amostras independentes, nos dizem que estamos olhando para a "diferença de duas médias". Isso significa que pegamos a média da população 1 ( ) e subtraímos a média da população 2 ( ). Portanto, nossa "diferença de dois meios" é ( - \ bar y_2 ). ˉ y 2 ˉ y 1 ˉ y 2
Ao estudar amostras pareadas, somos informados de que estamos observando a "diferença média", . Isso é calculado considerando a diferença entre cada par e calculando a média de todas essas diferenças.
Minha pergunta é: Nós obtemos o mesmo ( - ) versus seu se os tivermos calculado a partir de duas colunas de dados, e a primeira vez que consideramos duas amostras independentes e a segunda vez emparelhada dados? Eu brinquei com duas colunas de dados e parece que os valores são os mesmos! Nesse caso, pode-se dizer que os nomes diferentes são usados apenas por razões não quantitativas?
fonte
Respostas:
(Suponho que você queira dizer "amostra" e não "população" no seu primeiro parágrafo.)
A equivalência é fácil de mostrar matematicamente. Comece com duas amostras de tamanho igual, e . Em seguida, defina{ y 1 , … , y n } ˉ x{x1,…,xn} {y1,…,yn}
Então você tem:
fonte
a distribuição da diferença média deve ser mais rigorosa que a distribuição da diferença de médias. Veja isso com um exemplo fácil: média na amostra 1: 1 10 100 1000 média na amostra 2: 2 11 102 1000 a diferença de médias é 1 1 2 0 (diferente das amostras em si) tem um valor padrão pequeno.
fonte