Como testar se a média do subgrupo difere do grupo geral que inclui o subgrupo?

9

Como posso testar se a média (por exemplo, pressão arterial) de um subgrupo (por exemplo, aqueles que morreram) difere de todo o grupo (por exemplo, todos os que tiveram a doença, incluindo os que morreram)?

Claramente, o primeiro é um subgrupo do segundo.

Que teste de hipótese devo usar?

user1061210
fonte
Você está testando uma diferença de meios?
Macro

Respostas:

9

Como observa Michael, ao comparar um subgrupo com um grupo geral, os pesquisadores geralmente comparam o subgrupo ao subconjunto do grupo geral que não inclui o subgrupo.

Pense nisso desta maneira.

Se é a proporção que morreu, e 1 - p é a proporção que não morreu, ep1 1-p

X¯.=pX¯d+(1 1-p)X¯uma

onde é a média global, ˉ X d é a média daqueles que morreu, e ˉ X um é a média de aqueles que ainda estão vivos. EntãoX¯.X¯dX¯uma

se e somente se quando

X¯dX¯uma

X¯dX¯.

Suponha que . Daí ¯ X . p ¯ X d + ( 1 - p ) ¯ X d = ¯ X d .Xd¯Xuma¯X.¯pXd¯+(1 1-p)Xd¯=Xd¯

Suponha . Portanto, ¯ X dp ¯ X d + ( 1 - p ) ¯ X a , então ( 1 - p ) ¯ X d( 1 - p ) ¯ X a e desde que ( 1 - p ) 0 , então ¯ X d¯X.¯Xd¯Xd¯pXd¯+(1 1-p)Xuma¯(1 1-p)Xd¯(1 1-p)Xuma¯(1 1-p)0 0 .Xd¯Xuma¯

O mesmo se pode fazer com as desigualdades.

Assim, os pesquisadores geralmente testam a diferença entre o subgrupo e o subconjunto do grupo geral que não inclui o subgrupo. Isso tem o efeito de mostrar que o subgrupo difere do grupo geral. Também permite usar métodos convencionais, como um teste t de grupos independentes.

Jeromy Anglim
fonte
11
Re: "Você deve comparar o subgrupo com o subconjunto do grupo geral que não inclui o subgrupo" - sim, essa é uma maneira de fazer isso, mas faz uma pergunta um pouco diferente - ele testa mortos x não mortos quando ele parece que o OP quer testar a diferença de médias entre mortos e alguém cujo status de mortalidade é desconhecido, então não tenho certeza se essa é a palavra certa. Você pode testar a diferença de meios entre o subconjunto e o grupo geral, desde que você conta para a covariância entre e ¯ X . no seu cálculo de erro padrão. X¯dX¯.
Macro
@Macro bom ponto. obrigado. Eu mudei um pouco a redação para "pesquisadores normalmente ..."
Jeromy Anglim
@Marco. Obrigado pelo comentário. Mas como é a covariância computada de e ˉ X de grupos não emparelhados (subgrupo e grupo)? X¯dX¯
Giordano
2

A maneira de testar aqui é comparar aqueles que tiveram a doença e morreram com aqueles que tiveram a doença e não morreram. Você pode aplicar o teste t de duas amostras ou o teste da soma da classificação de Wilcoxon se a normalidade não puder ser assumida.

Michael R. Chernick
fonte
você pode ser mais específico? que tipo de teste t de duas amostras? teste t não pareado? Pensei no teste t, você assume INDEPENDÊNCIA e NORMALIDADE.
user1061210
11
Quando os grupos são separados, como sugerimos, as amostras são independentes. O teste t seria desemparelhado porque os subgrupos não precisam ser iguais e não existe uma maneira natural de emparelhar as amostras, mesmo que o tamanho das amostras seja igual. Mencionei o teste de Wilcoxon porque a suposição de normalidade pode não ser válida e o teste de Wilcoxon não exige normalidade.
Michael R. Chernick
0

O que você precisa fazer é testar as proporções da população (tamanho grande da amostra). As estatísticas que envolvem a proporção populacional geralmente têm um tamanho de amostra grande (n => 30); portanto, a distribuição normal de aproximação e as estatísticas associadas são usadas para determinar um teste para determinar se a proporção da amostra (pressão arterial dos que morreram) = proporção da população (todos que tiveram a doença, incluindo os que morreram).

Ou seja, quando o tamanho da amostra é maior ou igual a 30, podemos usar as estatísticas do escore z para comparar a proporção da amostra com a proporção da população usando o valor do desvio padrão da amostra p-hat, para estimar o desvio padrão da amostra, p se não for conhecido.

A distribuição amostral de P (proporção) é aproximadamente normal com um valor médio ou esperado, E (P) = p-hat e erro padrão, sigma (r) = sqrt (p * q / n).

A seguir, são apresentadas as possíveis perguntas da hipótese de teste que se pode fazer ao comparar duas proporções:

  1. (Teste bicaudal)

H0: p-hat = p vs H1: p-hat não é igual a p

  1. (Teste de cauda direita)

H0: p-hat = p vs H1: p-hat> p

  1. (Teste de cauda esquerda)

H0: p-hat = p vs H1: p-hat <p

As estatísticas usadas para testar o tamanho da amostra grande são;

As estatísticas do teste estão relacionadas à distribuição normal padrão:

As estatísticas do escore z para proporções

p-hat-p / sqrt (pq / n)

, em que p = estimativa de proporção, q = 1-p e é a proporção da população.

A média da proporção é:

np / n = p-hat = x / n

Desvio padrão:

= sqrt (npq / n) = sqrt (pq / n)

Regras de decisão:

Teste de cauda superior (): (H0: P-hat> = P)

Aceite H0 se Z <= Z (1-alfa)

Rejeite H0 se Z> Z (1-alfa)

Teste de cauda inferior (Ha: P-hat <= P):

Aceite H0 se Z> = Z (1-alfa)

Rejeite H0 se Z

Teste bicaudal (Ha: chapéu P não é igual a P):

Aceite H0 se Z (alfa / 2) <= Z <= Z (1-alfa / 2)

Rejeite H0 se Z <Z (alfa / 2) ou se Z> Z (1-alfa / 2)

Chiemeka Ezeogu
fonte