O que você faz se seus graus de liberdade ultrapassam o final de suas mesas?

11

Os graus de liberdade na minha tabela F não aumentam o suficiente para a minha grande amostra.

Por exemplo, se eu tenho um F com 5 e 6744 graus de liberdade, como encontro o valor crítico de 5% para uma ANOVA?

E se eu estivesse fazendo um teste do qui-quadrado com grandes graus de liberdade?

[Uma pergunta como essa foi postada há um tempo atrás, mas o OP cometeu um erro e, na verdade, tinha um df menor, reduzindo-o a uma duplicata - mas a pergunta df grande e original deveria ter uma resposta em algum lugar do site]

Glen_b -Reinstate Monica
fonte
1
Obter uma mesa maior?
Federico Poloni

Respostas:

16

Tabelas F :

  1. A maneira mais fácil de todas - se você puder - é usar um pacote de estatísticas ou outro programa para fornecer o valor crítico. Então, por exemplo, em R, podemos fazer isso:

     qf(.95,5,6744)
    [1] 2.215425
    

    (mas você pode calcular com facilidade o valor p exato para o seu F).

  2. Normalmente, as tabelas F possuem um grau de liberdade "infinito" no final da tabela, mas algumas não. Se você tiver um df muito grande (por exemplo, 6744 é muito grande), poderá usar a entrada infinito ( ) em seu lugar.

    Portanto, você pode ter tabelas para que fornecem 120 df e df:ν1=5

          ...    5      ...
     ⁞
    120        2.2899   
     ∞         2.2141
    

    A linha df lá funcionará para qualquer realmente grande (denominador df). Se usarmos isso, temos o 2.2141 em vez do exato 2.2154, mas isso não é tão ruim.ν2

  3. Se você não possui uma entrada com graus infinitos de liberdade, pode trabalhar uma a partir de uma tabela qui-quadrado, usando o valor crítico para o numerador df dividido por aqueles df

    Por exemplo, para um valor crítico de , pegue um valor crítico de e divida por . O valor crítico de 5% para a é . Se dividirmos por isso é que é a linha da tabela acima.F5,χ525χ5211.070552.2141

  4. Se seus graus de liberdade podem ser um pouco pequenos demais para usar a entrada "infinito" (mas ainda muito maior que 120 ou qualquer que seja a sua tabela), você pode usar a interpolação inversa entre o df finito mais alto e a entrada infinita. Digamos que queremos calcular um valor crítico para dfF5,674

       F       df     120/df    
     ------   ----    -------
     2.2899    120      1     
       C       674    0.17804
     2.2141     ∞       0    
    

    Em seguida, calculamos o valor crítico desconhecido, comoC

    C2.2141+(2.28992.2141)×(0.178040)/(10)2.2276

    (O valor exato é , para que funcione muito bem.)2.2274

    Mais detalhes sobre interpolação e interpolação inversa são fornecidos nesse post vinculado.


Tabelas qui-quadrado :

Se seu df qui-quadrado é realmente grande, você pode usar tabelas normais para obter uma aproximação.

Para df grande, a distribuição qui-quadrado é aproximadamente normal com média e variância . Para obter o valor superior a 5%, use o valor crítico unilateral de 5% para um normal padrão ( ) e multiplique por e adicione .νν2ν1.6452νν

Por exemplo, imagine que precisávamos de um valor crítico superior a 5% para a .χ67442

Calcularíamos . A resposta exata (para algarismos significativos) é .1.645×2×6744+6744693556936.2

Se os graus de liberdade forem menores, podemos usar o fato de que, se for então .Xχν22X˙N(2ν1,1)

Por exemplo, se tivéssemos df, poderíamos usar essa aproximação. O valor crítico exato superior de 5% para um qui-quadrado com 674 df é (para 5 algarismos) . Com essa aproximação, calcularíamos da seguinte maneira:674735.51

Pegue o valor crítico superior de 5% (uma cauda) para um normal normal (1.645), adicione , quadrie o total e divida por 2. Nesse caso:2ν1

(1.645+2×6741)2/2735.2 .

Como vemos, isso é bem próximo.

Para graus de liberdade consideravelmente menores, a transformação Wilson-Hilferty poderia ser usada - ela funciona apenas com alguns graus de liberdade - mas as tabelas devem cobrir isso. Essa aproximação é que .(Xν)13˙N(129ν,29ν)

Glen_b -Reinstate Monica
fonte
2
+1 A idéia pode ser aprimorada. Use o fato de que limita a uma função racional de uma medida que seu segundo parâmetro aumenta. Em , por exemplo, você o computaria como . Você obterá , com precisão de três números significativos. Observe que o parâmetro é um número inteiro pequeno, indicando que provavelmente estará na tabela e estará disponível sem interpolação. F χ 2 2,2177 χ 2χ2Fχ2Rdf2/df1 * (-1 + 1/(1-qchisq(0.95, df1) / df2))2.2177χ2
whuber
Suponho que perdi alguma coisa aqui - tentei várias vezes descobrir qual a vantagem que você significa nesta melhoria em relação ao que fiz no item 3 (que já a trata como função simples de um qui-quadrado com pequeno número inteiro df, como seria sugerido pelo teorema de Slutsky como df2 ). No exemplo em questão, minha aproximação é mais simples de executar e mais precisa (por exemplo, tem cerca de 57% do erro absoluto). Esta sugestão é melhor em outros valores dos dois df's, ou melhor porque é conservadora em vez de anti-conservadora, ...
Glen_b -Reinstate Monica
... ou é a intenção de que os erros das duas abordagens sejam de direção oposta (sugerindo talvez combinar as duas?).
Glen_b -Reinstala Monica
Lembro que estava me referindo ao item 4.
whuber
Ah, isso pode fazer mais sentido. Desculpe ser densa. Vou tentar de novo.
Glen_b -Reinstala Monica