Entendendo a saída de um bootstrap executado no R (tsboot, MannKendall)

11

Eu tenho uma pergunta sobre a interpretação da chamada tsboot em R. Verifiquei a documentação do Kendall e do pacote de inicialização, mas não sou mais inteligente do que antes.

Quando executo um bootstrap usando, por exemplo, o exemplo no pacote Kendall, onde a estatística de teste é a tau do Kendall:

library(Kendall)
# Annual precipitation entire Great Lakes
# The Mann-Kendall trend test confirms the upward trend.
data(PrecipGL)
MannKendall(PrecipGL)

o que confirma a tendência de alta:

tau = 0.265, 2-sided pvalue =0.00029206

O exemplo continua a usar um bloco de inicialização:

#
#Use block bootstrap 
library(boot)
data(PrecipGL)
MKtau<-function(z) MannKendall(z)$tau
tsboot(PrecipGL, MKtau, R=500, l=5, sim="fixed")

Eu recebo o seguinte resultado:

BLOCK BOOTSTRAP FOR TIME SERIES
Fixed Block Length of 5 
Call:
tsboot(tseries = PrecipGL, statistic = MKtau, R = 500, l = 5, 
sim = "fixed")


Bootstrap Statistics :
 original     bias    std. error
t1* 0.2645801 -0.2670514  0.09270585

Se bem entendi, o "t1 * original" é o MKtau original, o "viés" é a média do MKtau da série temporal R = 500, e o "erro padrão" é o desvio padrão do MKtaus de as 500 amostras.

Eu tenho problemas para entender o que isso significa - isso basicamente me diz que todos os 500 MKTaus são inferiores ao original e que o t1 * original está na faixa de 3 sd do MKtaus inicializado. Ergo é significativamente diferente?

Ou eu diria que o MKtau para o conjunto de dados é 0,26 mais / menos erro padrão?

Sinto muito pela pergunta demorada, mas sou iniciante em estatística e estou aprendendo por auto-estudo, sem alguém para devolver esse problema provavelmente muito simples.

Maria
fonte
6
Na saída, biasexiste simplesmente a diferença entre a média das 500 amostras de bootstrap armazenadas e a estimativa original. O std. erroré o desvio padrão das 500 amostras de autoinicialização e é uma estimativa do erro padrão. A saída informa que sua estimativa original é maior que a média das 500 estimativas iniciadas por inicialização (portanto, nem todos os MKtaus iniciados por inicialização são menores). O bootstrap é frequentemente usado para calcular erros padrão / intervalos de confiança sem fazer suposições sobre a distribuição. Use a boot.cifunção para calcular os intervalos de confiança.
COOLSerdash
@COOLSerdash, obrigado por isso! Portanto, se minha estatística original é 3 sd maior que a média da estatística inicializada, posso concluir algo diretamente (digamos: estatística é significativa em 0,99)? Também usei o boot.cipara calcular os intervalos de confiança e, novamente, a estatística originalmente calculada está fora desses intervalos.
Maria
Não, você não compara a estatística de inicialização com a estatística original com um teste de hipótese. Gostaria apenas de usar / relatar o erro padrão de inicialização e os intervalos de confiança no seu caso.
COOLSerdash

Respostas:

3

Tendo encontrado a mesma pergunta e explorado com um conjunto de dados controlado - modelo y = ax + b com erros N (0, sig), acho que o pacote Kendall pode não estar funcionando como anunciado. O x no meu caso era 1:100, e y = x , com sig = 100 (variação do termo do erro).

A regressão parece boa, e o tau de Kendall também. Não há autocorrelação aqui além da induzida pelo modelo linear. A execução do teste de Kendall conforme anunciado com comprimentos de bloco de 1, 3, 5 e 10 gera valores de viés muito grandes e boot.cinão indica tendência.

Posteriormente, codifiquei manualmente o bootstrap dos dados com esses comprimentos de bloco e, com minha série de controles, obtenho resultados razoáveis ​​quanto à média das amostras de bootstrap e sua propagação. Portanto, é possível que algo tenha dado errado com o pacote Kendall em relação à inicialização do bloco.

user46157
fonte