Por que os dados devem ser reamostrados sob hipótese nula no teste de hipótese de autoinicialização?

11

A aplicação direta dos métodos de bootstrap ao teste de hipóteses é estimar o intervalo de confiança da estatística de teste calculando-o repetidamente nas amostras com bootstrap (deixe que a estatística amostrada no bootstrap seja chamada ). Rejeitamos se o parâmetro hipotético (que geralmente é igual a 0) estiver fora do intervalo de confiança de . θ ^ θ * H0θ0 ^ θ *θ^θ^θ^H0θ0θ^

Eu li que esse método carece de algum poder. No artigo de Hall P. e Wilson SR "Duas Diretrizes para Teste de Hipóteses de Bootstrap" (1992) , está escrito como a primeira diretriz, que se deve reamostrar , não o . E esta é a parte que eu não entendo.^ θ * -θ0θ^θ^θ^θ0

Não é que o mede apenas o viés do estimador ? Para estimadores imparciais, os intervalos de confiança dessa expressão sempre devem ser menores que , mas não vejo o que isso tem a ver com o teste de ? Não há nenhum lugar em que possamos ver informações sobre o .^ θ * ^ θ * -θ0 θ =θ0θ0θ^θ^θ^θ^θ0θ^=θ0θ0


Para aqueles de vocês que não têm acesso a este artigo, esta é uma citação do parágrafo relevante que vem imediatamente após a tese:

Para entender por que isso é importante, observe que o teste envolverá a rejeição de se em é "muito grande". Se estiver muito distante do valor verdadeiro de (ou seja, se for o erro grosseiro), a diferença nunca parecerá muito grande comparado à distribuição não-paramétrica de bootstrap de. Uma comparação mais significativa é com a distribuição de. De fato, se o valor verdadeiro de for| Θ - θ 0 | θ 0 θ H 0 | Θ - θ 0 | | Θ - θ 0 | | ^ Θ * - θ | θ θ 1 | θ 1 - θ 0 | | ^ Θ * - θ | | θ 1 - θ 0 |H0|θ^θ0|θ0θH0|θ^θ0||θ^θ0||θ^θ^|θθ1então o poder do teste de autoinicialização aumenta para 1 comoaumenta, desde que o teste seja baseado na reamostragem , mas a potência diminui para no máximo o nível de significância (à medida que aumenta) se o teste for baseado em reamostragem |θ1θ0||θ^θ^||θ1θ0||θ^θ0|

Adam Ryczkowski
fonte

Respostas:

7

Este é o princípio da analogia de inicialização. A distribuição verdadeira (desconhecida) subjacente produziu uma amostra à mão com o cdf , que por sua vez produziu a estatística para alguns funcionais . Sua ideia de usar o bootstrap é fazer declarações sobre a distribuição de amostragem com base em uma distribuição conhecida , onde você tenta usar um protocolo de amostragem idêntico (que é exatamente possível apenas para dados iid; dados dependentes sempre levam a limitações de como com precisão, é possível reproduzir o processo de amostragem) e aplicar o mesmo funcional . Eu demonstrei em outro postx 1 , ... , x n F n θ = T ( M n ) t ( ) ~ F T ( ) θ - θ 0 θ * ~ F T ( ) T ( ~ M ) ~ F = F n t ( M n ) qFx1,,xnFnθ^=T(Fn)T()F~T()com (o que eu acho que é) um diagrama puro. Portanto, o análogo de bootstrap do desvio (amostragem + sistemático) , a quantidade de seu interesse central, é o desvio da replicação de bootstrap do que é conhecido como verdadeiro para a distribuição , o processo de amostragem aplicado e o funcional , ou seja, sua medida de tendência central é . Se você usou a autoinicialização não paramétrica padrão com substituição dos dados originais, seu , portanto, sua medida da tendência central deve ser base nos dados originais.θ^θ0θ^F~T()T(F~)F~=FnT(Fn)θ^

Além da tradução, há problemas mais sutis nos testes de inicialização que às vezes são difíceis de superar. A distribuição de uma estatística de teste sob o nulo pode ser drasticamente diferente da distribuição da estatística de teste sob a alternativa (por exemplo, em testes nos limites do espaço do parâmetro que falham com o bootstrap ). Os testes simples que você aprende nas aulas de graduação, como o teste são invariantes durante o turno, mas pensar: "Caramba, eu mudo tudo" falha quando você precisa passar para o próximo nível de complexidade conceitual, os assintóticos . Pense nisso: você está testando e sua observada . Então, quando você constrói umχ 2 μ = 0 ˉ x = 0,78 χ 2 ( ˉ x - μ ) 2 / ( s 2 / n ) ˉ x 2 / ( s 2 / n ) ˉ x 2 * / ( s 2 * / n ) n ˉ x 2 / s 2tχ2μ=0x¯=0.78χ2 teste com o analógico de auto-inicialização , então este teste possui uma não centralidade embutida de desde o início, em vez de ser um teste central, como seria de esperar. Para tornar o teste de autoinicialização central, você realmente precisa subtrair a estimativa original.(x¯μ)2/(s2/n)x¯2/(s2/n)x¯2/(s2/n)nx¯2/s2

Os são inevitáveis ​​em contextos multivariados, variando de Pearson para tabelas de contingência ao bootstrap de Bollen-Stine da estatística de teste em modelos de equações estruturais. O conceito de mudar a distribuição é extremamente difícil de definir bem nessas situações ... embora, no caso de testes nas matrizes de covariância multivariada, isso seja possível por uma rotação apropriada .χ 2χ2χ2

StasK
fonte
Obrigado. Há uma coisa que eu ainda não entendo: onde colocamos informações sobre no bootstrap? Onde H 0 é falso, o θ 0 pode estar consideravelmente fora da distribuição verdadeira. θ0H0θ0
Adam Ryczkowski 2/11
Como você calcula o valor p sob o nulo, deve considerar o caso em que o está em conformidade com o nulo. É claro que considerar a alternativa é uma alternativa, mas isso é ... uau ... isso seria um uso avançado da metodologia de teste de autoinicialização. θ0
StasK
3

OK, entendi. Obrigado, StasK, por uma resposta tão boa. Vou mantê-lo aceito para que outros aprendam, mas, no meu caso particular, estava perdendo um fato muito simples:

O procedimento de bootstrap, de acordo com as diretrizes de Hall & Wilson para o teste médio de uma amostra simples, é este (no pseudo-código inspirado em R):

1function(dataθ0 ) {
2 θ^ t.test(data, mu = θ0 )$statistic
3 count 0
4for(i in 1:1000){
5 bdata sample(data)
6 θ^ t.test(bdata, mu = θ^ )$statistic
7 if ( θ^θ^ ) count++
8 }
9 count/1000
10 }

θ02θ^

26p.valuestatistic7

Adam Ryczkowski
fonte
θ^θθ0(θ^θ^)(θ^θ0)
1
Talvez útil: Michael Chernick forneceu uma intuição sucinta em resposta à minha pergunta relacionada aqui. stats.stackexchange.com/questions/289236/… )
passe metade do dia