A homogeneidade da amostra é uma suposição da análise de regressão?

8

Eu assumi (ou seja, acho que fui ensinado, há mais tempo do que me lembro) que as análises de regressão assumem que uma amostra é homogênea. Caso contrário, o apropriado é adicionar variáveis ​​fictícias ao código para os diferentes grupos incluídos na amostra ou executar uma ANCOVA para testar se os parâmetros do grupo são iguais. Ignorar a heterogeneidade de uma amostra invalida uma análise de regressão?

TAD
fonte

Respostas:

8

A amostra geralmente é assumida como homogênea no sentido de que os termos de erro na equação atendem às seguintes condições:ϵiyi=β0+β1x1+β2x2++ϵi

  1. Todos têm média zero: para todos os i ,E(ϵi)=0i
  2. Não estão correlacionados: para i j ,Cov(ϵi,ϵj)=0ij
  3. Cov(ϵi)=σ2i

Elas são conhecidas como condições de Gauss-Markov e garantem que o estimador de mínimos quadrados ordinário tenha um bom desempenho (imparcialidade, melhor estimador linear imparcial ...).

Observe que essas condições podem ser satisfeitas mesmo se você tiver observações de diferentes grupos. Muitas vezes, esse não é o caso. Se houver diferenças na média entre os grupos, a primeira e a segunda condições serão violadas. Se houver correlações dentro dos grupos, a segunda condição será violada. Se os grupos diferirem em variação, o terceiro será violado.

A violação das condições de Gauss-Markov pode causar todos os tipos de problemas. Para algumas das consequências da variação não constante, consulte a página da Wikipedia sobre heterocedasticidade .

As transformações podem ser úteis quando a terceira condição não for atendida, mas se os diferentes grupos causarem problemas com as condições um e dois, parece mais razoável adicionar uma variável fictícia de grupo ou usar ANCOVA.

MånsT
fonte
1
E(ε)=0 0
Estou removendo minha resposta não porque algo esteja errado, mas porque a última resposta de MansT cobre mais completamente, exceto a parte sobre modelagem da função de variação, conforme descrito no livro de Ray Carroll.
22660 Michael Jackson Chernick