Correção de comparações múltiplas para comparações dependentes

7

Em deste blog postar os autores discutem simultaneamente estimar quantis, e construção de um envelope simultâneo da confiança para a estimativa que abrange toda a função quantil. Eles fazem isso iniciando e calculando os intervalos de confiança no momento e aplicando uma correção do tipo Bonferroni para múltiplas comparações. Como as comparações não são independentes, elas calculam algo como um número efetivo de ensaios independentes de acordo com uma fórmula

Neq=N2i,jr(bi,bj)

onde é o número de pontos a ser estimado e é a correlação entre a amostra de e th vectores de bootstrap.Nr(bi,bj)ithj

Minha pergunta é de onde vem essa fórmula. Eles fornecem um link para uma fonte, mas não vejo essa fórmula na fonte. Alguém está ciente dessa correção específica sendo usada na literatura?

crf
fonte

Respostas:

5

Vamos considerar um problema mais simples, mas intimamente relacionado. Suponha que você tenha um vetor cujas entradas têm uma matriz de correlação . Se for diagonal, a variação da média da amostra de é . Se todos os forem iguais, isso se reduzirá ao mais comumente , e podemos reorganizar os termos para obter o tamanho da amostra em função das duas variações:xRRxσx¯2=σi2/n2σi2σ2/n

n=σ2/σx¯2

Se, no entanto, não for diagonal, a variação de será igual a:Rx¯

σx¯2=ijσiσjrij/n2

No caso em que , isso se reduz a:σi=σj  i,j

σx¯2=σ2ijrij/n2

Por analogia com a expressão para o tamanho da amostra no caso não correlacionado, a proporção entre este e é o "tamanho efetivo da amostra" :σ2ness

ness=σ2/σx¯2=σ2σ2ijrij/n2=n2ijrij

Se for diagonal, então , pois os elementos diagonais de iguais a e todos os elementos fora da diagonal são iguais a , e o tamanho efetivo da amostra é igual ao tamanho real da amostra, como seria de esperar .Rijrij=nnR10

A comparação do tamanho efetivo da amostra com o tamanho real da amostra fornece uma estimativa do impacto da correlação diferente de zero no seu problema de estimativa. Claramente, se suas correlações são altas (positivas ou negativas), ou você tem muitas delas, os efeitos podem ser bastante substanciais.

O relacionamento entre este exemplo e seu caso é o seguinte. Em vez de "tamanho da amostra", considere como o número de quantis sendo estimado. A correção básica de Bonferroni se ajusta para comparações. Como se sabe que as estimativas dos quantis estão correlacionadas, no entanto, a correção de Bonferroni (no caso de correlações positivas) será muito pessimista (mesmo para Bonferroni, que em geral é bastante pessimista). nn

Para ver isso, considere uma situação em que você está estimando dez quantis e os erros nas estimativas quantílicas estão perfeitamente correlacionados. Por exemplo, suponha que você esteja estimando os quantis de uma distribuição Normal com variação conhecida igual a um; todas as suas estimativas terão o formato , onde depende do quantil em questão. Os erros em suas estimativas quantílicas serão todos exatamente iguais ao erro em sua estimativa da média; portanto, a coleta de intervalos de confiança pontuais será igual ao intervalo de confiança simultâneo. Na verdade, você tem apenas uma estimativa, mas Bonferroni (sem correção) ajustará seus intervalos de confiança como se você tivesse dez estimativas, tornando-o mais amplo do que deveria ser. O cálculo acima, comx¯±kkrij=1  i,j resultará em , como deveria, e o intervalo de Bonferroni usando o tamanho efetivo da amostra, neste caso, estará correto.ness=1

Quanto à fonte, está no artigo (Solow-Polasky) vinculado ao link que você fornece; a fórmula é a equação (7), embora a notação seja completamente diferente.

jbowman
fonte