O bootstrap pode ser usado para substituir testes não paramétricos?

15

Eu sou bastante novo em estatísticas. O conceito de bootstrapping tem sido confuso para mim.

Eu sei que a normalidade da distribuição da amostra é necessária para usar certos testes, como o teste t. Nos casos em que os dados normalmente não são distribuídos, solicitando "bootstrapping" em testes t no SPSS, isso contornaria o problema de não normalidade? Em caso afirmativo, a estatística t relatada na saída é baseada na distribuição de amostragem com bootstrap?

Além disso, esse seria um teste melhor comparado ao uso de testes não paramétricos como Mann-Whitney ou Kruskal-Wallis nos casos em que tenho dados não normais? Em situações em que os dados não são normais e eu estou usando o bootstrap, eu não reportaria a estatística t: certo?

JC22
fonte

Respostas:

16

O bootstrap funciona sem a necessidade de suposições como normalidade, mas pode ser altamente variável quando o tamanho da amostra é pequeno e a população não é normal. Portanto, pode ser melhor no sentido das suposições, mas não é melhor em todos os aspectos.

As amostras de bootstrap com substituição, a permutação testa amostra sem substituição. Os testes de Mann-Whitney e outros não paramétricos são realmente casos especiais do teste de permutação. Na verdade, eu prefiro o teste de permutação aqui porque você pode especificar uma estatística de teste significativa.

A decisão sobre qual teste usar deve ser baseada na pergunta que está sendo respondida e no conhecimento sobre a ciência que leva aos dados. O Teorema do Limite Central nos diz que ainda podemos obter boas aproximações dos testes t, mesmo quando a população não é normal. A qualidade das aproximações depende da forma da distribuição da população (não da amostra) e do tamanho da amostra. Existem muitos casos em que um teste t ainda é razoável para amostras menores (e alguns casos em que não é bom o suficiente em amostras muito grandes).

Greg Snow
fonte
Obrigado, isso é útil. Portanto, se eu usar o bootstrap, apenas reportaria o valor de p e o IC sem nenhuma estatística de teste, isso está correto?
JC22
(+1) Você teria, por acaso, uma referência ou um link sobre os testes de Mann-Whitney e de permutação? Isso é muito interessante, mas não óbvio para mim!
Gala
4
@ JC22 Você deve relatar uma estatística de teste (qualquer estatística que você inicializar); um teste de autoinicialização baseado em uma média será diferente de um teste baseado em uma média aparada, por exemplo.
Glen_b -Reinstar Monica
2
@ GaëlLaurans Para um exemplo de geração da distribuição exata (permutação) da estatística do teste de soma da classificação de Wilcoxon (equivalente a Mann-Whitney) e da estatística do teste de Kruskal-Wallis, consulte esta resposta .
precisa
2
@ GaëlLaurans, na referência é: Resultados Diferentes do Teste Wilcoxon — Mann-Whitney de Diferentes Pacotes Estatísticos Reinhard Bergmann, John Ludbrook e Will PJM Spooren Journal: The American StatisticianVolume 54, Edição 1, fevereiro 1, páginas 72-77
Greg Snow