O que é um teste estatístico robusto? O que é um poderoso teste estatístico?

14

Alguns testes estatísticos são robustos e outros não. O que exatamente significa robustez? Surpreendentemente, não consegui encontrar essa pergunta neste site.

Além disso, às vezes, a robustez e a potência de um teste são discutidas juntas. E, intuitivamente, não consegui diferenciar os dois conceitos. O que é um teste poderoso? Qual a diferença de um teste estatístico robusto?

Fuso horário
fonte
2
Poder e robustez são conceitos ortogonais, mesmo que sejam duas propriedades importantes de um teste. Parece-me que seria melhor fazer duas perguntas separadas.
perfil completo de Stephan Kolassa
2
Poderíamos dizer robustez como propriedade de um procedimento adaptado que é insensível a violações de algumas suposições de sua teoria central.
Firebug

Respostas:

21

A robustez tem vários significados nas estatísticas, mas todos implicam certa resiliência a alterações no tipo de dados utilizados. Isso pode parecer um pouco ambíguo, mas isso ocorre porque robustez pode se referir a diferentes tipos de insensibilidade a mudanças. Por exemplo:

  • Robustez para outliers
  • Robustez à não normalidade
  • Robustez para variância não constante (ou heterocedasticidade)

No caso de testes , robustez geralmente se refere ao teste ainda sendo válido, dada essa alteração. Em outras palavras, se o resultado é significativo ou não, apenas é significativo se as premissas do teste forem atendidas. Quando essas suposições são relaxadas (isto é, não são tão importantes), o teste é considerado robusto.

O poder de um teste é sua capacidade de detectar uma diferença significativa se houver uma diferença real. A razão pela qual testes e modelos específicos são usados ​​com várias suposições é que essas suposições simplificam o problema (por exemplo, exigem menos parâmetros a serem estimados). Quanto mais suposições um teste faz, menos robusto ele é, porque todas essas suposições devem ser atendidas para que o teste seja válido.

Por outro lado, um teste com menos suposições é mais robusto. No entanto, a robustez geralmente tem o custo de energia, porque menos informações da entrada são usadas ou mais parâmetros precisam ser estimados.

Robusto
Um -test pode ser dito para ser robusto, porque ao mesmo tempo que assume grupos normalmente distribuídos, é ainda um teste válido para a comparação de , aproximadamente, grupos normalmente distribuídos.t

Um teste de Wilcoxon é menos poderoso quando as suposições do teste são atendidas, mas é mais robusto, porque não assume uma distribuição subjacente e, portanto, é válido para dados não normais. Seu poder é geralmente menor porque utiliza as classificações dos dados, em vez dos números originais e, portanto, essencialmente descarta algumas informações.t

Não Robusto
Um teste é uma comparação de variações, mas é muito sensível à não normalidade e, portanto, inválido para uma normalidade aproximada. Em outras palavras, o teste não é robusto.FF

Frans Rodenburg
fonte
1
Sua resposta é muito clara e fácil de entender. Eu editei por pergunta para perguntar mais sobre se um teste é powerfulcomo eu o vejo discutindo isso em sua resposta. Você se importaria de explicar o que significa um teste poderoso?
JetLag 8/11
Incluí uma breve descrição de como isso se relaciona com o poder de um teste.
Frans Rodenburg
1
Esta é uma ótima resposta, só quero acrescentar que existem maneiras de formalizar a definição. Alguns consideram que um teste é robusto se tiver tanto a robustez da validade , ou seja, o nível de significância do teste é estável, dadas pequenas diferenças em relação ao nulo, quanto a robustez da eficiência , ou seja, a energia ainda é boa, considerando-se pequenas variações da alternativa especificada; e essas qualidades podem ser quantificadas através do uso de funções de influência .
Francis
1
@ Eric, a equivalência não é verdadeira apenas para dois grupos?
Sextus Empiricus
1
F
3

Não existe uma definição formal de "teste estatístico robusto", mas existe uma espécie de concordância geral quanto ao que isso significa. O site da Wikipedia tem uma boa definição disso (em termos estatísticos, e não o teste em si):

Estatísticas robustas são estatísticas com bom desempenho para dados extraídos de uma ampla variedade de distribuições de probabilidade, especialmente para distribuições que não são normais.

https://en.wikipedia.org/wiki/Robust_statistics

Rob Ustinov
fonte