Diferença de Média vs. Diferença Média

10

Ao estudar duas amostras independentes, nos dizem que estamos olhando para a "diferença de duas médias". Isso significa que pegamos a média da população 1 ( ) e subtraímos a média da população 2 ( ). Portanto, nossa "diferença de dois meios" é ( - \ bar y_2 ). ˉ y 2 ˉ y 1 ˉ y 2y¯1y¯2y¯1y¯2

Ao estudar amostras pareadas, somos informados de que estamos observando a "diferença média", d¯ . Isso é calculado considerando a diferença entre cada par e calculando a média de todas essas diferenças.

Minha pergunta é: Nós obtemos o mesmo ( y¯1 - y¯2 ) versus seu d¯ se os tivermos calculado a partir de duas colunas de dados, e a primeira vez que consideramos duas amostras independentes e a segunda vez emparelhada dados? Eu brinquei com duas colunas de dados e parece que os valores são os mesmos! Nesse caso, pode-se dizer que os nomes diferentes são usados ​​apenas por razões não quantitativas?

user84756
fonte
2
Pense da seguinte maneira: como você calcularia com dados não emparelhados? d¯
shadowtalker
3
@ssdecontrol Especialmente se os tamanhos das amostras forem diferentes.
Alexis

Respostas:

11

(Suponho que você queira dizer "amostra" e não "população" no seu primeiro parágrafo.)

A equivalência é fácil de mostrar matematicamente. Comece com duas amostras de tamanho igual, e . Em seguida, defina{ y 1 , , y n } ˉ x{x1,,xn}{y1,,yn}

x¯=1ni=1nxiy¯=1ni=1nyid¯=1ni=1nxiyi

Então você tem:

x¯y¯=(1ni=1nxi)(1ni=1nyi)=1n(i=1nxii=1nyi)=1n((x1++xn)(y1++yn))=1n(x1++xny1yn)=1n(x1y1++xnyn)=1n((x1y1)++(xnyn))=1ni=1nxiyi=d¯.
shadowtalker
fonte
11
Mas dois intervalos de confiança calculados para "a diferença dos meios" e "a diferença média" serão diferentes, certo? Isso pode ser visto olhando para e . Uma "diferença média" emparelhada será diferente para (que é zero) versus (que não é zero); a diferença dos meios não é afetada pela ordem dos elementos. B = [ . . . , 5 , 4 , 3 , 2 , 1 ] A - A A - BA=[1,2,3,4,5,...]B=[...,5,4,3,2,1]AAAB
BERS
Não consigo mais editar minha postagem anterior. A terceira frase deve começar "Uma sequência de 'diferenças médias' emparelhadas ..." "
bers
@bers, o que tem a ver com isso? AA
shadowtalker
Suponha . Então e são duas seqüências diferentes. O intervalo de confiança para a diferença média emparelhada certamente será diferente nos dois casos. Mas a diferença de médias e, portanto, o intervalo de confiança, será idêntica para e . Ou eu estou errado? A - C A - B A - C A - BC=AACABACAB
BERS
@bers Eu acho que você está confuso, mas estou confuso quanto ao que você está confuso.
shadowtalker
0

a distribuição da diferença média deve ser mais rigorosa que a distribuição da diferença de médias. Veja isso com um exemplo fácil: média na amostra 1: 1 10 100 1000 média na amostra 2: 2 11 102 1000 a diferença de médias é 1 1 2 0 (diferente das amostras em si) tem um valor padrão pequeno.

Vlad
fonte