Eu tenho duas amostras de dados, uma amostra de linha de base e uma amostra de tratamento.
A hipótese é que a amostra de tratamento tenha uma média mais alta que a amostra da linha de base.
Ambas as amostras são de forma exponencial. Como os dados são bastante grandes, só tenho a média e o número de elementos para cada amostra no momento em que executarei o teste.
Como posso testar essa hipótese? Eu acho que é super fácil e já deparei com várias referências ao uso do Teste-F, mas não tenho certeza de como os parâmetros são mapeados.
hypothesis-testing
statistical-significance
exponential
Jonathan Dobbie
fonte
fonte
Respostas:
Você pode testar a igualdade dos parâmetros médios contra a alternativa de que os parâmetros médios são desiguais com um teste de razão de verossimilhança (teste LR). (No entanto, se os parâmetros médios diferirem e a distribuição for exponencial, será uma mudança de escala, não uma mudança de local.)
Para um teste unilateral (mas apenas assintoticamente no caso bicaudal), acredito que o teste LR é equivalente ao seguinte (para mostrar que, na verdade, é o mesmo que o teste LR para o teste unilateral) caso fosse necessário mostrar que a estatística LR era monotônica em ):x¯/y¯
Digamos que parametrizamos a ésima observação no primeiro exponencial como tendo pdf e a ésima observação no segundo exemplo como tendo pdf (sobre os domínios óbvios para as observações e parâmetros). (Para deixar claro, estamos trabalhando na forma média e não na forma de taxa aqui; isso não afetará o resultado dos cálculos.)1 / μ x exp ( - x i / μ x ) j 1 / μ y exp ( - y j / μ y )i 1/μxexp(−xi/μx) j 1/μyexp(−yj/μy)
Como a distribuição de é um caso especial da gama, , a distribuição da soma de 's, é distribuída ; da mesma forma que para a soma dos s, é . Γ ( 1 , μ x ) X S x Γ ( n x , μ x ) Y S y Γ ( n y , μ y )Xi Γ(1,μx) X Sx Γ(nx,μx) Y Sy Γ(ny,μy)
Devido ao relacionamento entre distribuições gama e distribuições qui-quadrado, verifica-se que é distribuído . A razão de dois qui-quadrados em seus graus de liberdade é F. Portanto, a razão, .χ 2 2 n x μ y2/μxSx χ22nx μyμxSx/nxSy/ny∼F2nx,2ny
Sob a hipótese nula de igualdade de médias, então, e sob a alternativa de dois lados, os valores podem tender a ser menores ou maiores que um valor nulo distribuição, então você precisa de um teste bicaudal.x¯/y¯∼F2nx,2ny
Simulação para verificar se não cometemos algum erro simples na álgebra:
Aqui simulei 1000 amostras do tamanho 30 para e 20 para partir de uma distribuição exponencial com a mesma média e calculei a estatística da razão de médias acima.YX Y
Abaixo está um histograma da distribuição resultante, bem como uma curva que mostra a distribuição que computamos sob o valor nulo:F
Exemplo, com discussão do cálculo de valores p bicaudais :
Para ilustrar o cálculo, aqui estão duas pequenas amostras de distribuições exponenciais. A amostra X tem 14 observações de uma população com média 10, a amostra Y tem 17 observações de uma população com média 15:
As médias da amostra são 12.082 e 16.077, respectivamente. A relação de médias é 0,7515
A área à esquerda é direta, pois está na cauda inferior (calc em R):
Precisamos da probabilidade para a outra cauda. Se a distribuição fosse simétrica no inverso, seria simples fazer isso.
Uma convenção comum com a relação de variâncias do teste F (que é similarmente bicaudal) é simplesmente dobrar o valor p unicaudal (efetivamente o que está acontecendo como aqui ; é também isso que parece ser feito em R, por exemplo ); neste caso, fornece um valor-p de 0,44.
No entanto, se você fizer isso com uma regra de rejeição formal, colocando uma área de em cada cauda, obterá valores críticos conforme descrito aqui . O valor de p é então o maior que levaria à rejeição, o que equivale a adicionar o valor de p unicaudal acima ao valor de p unicaudal na outra cauda para os graus de liberdade trocados. No exemplo acima, que fornece um valor p de 0,43.αα/2 α
fonte
Como um adendo à resposta de @ Glen_b, a taxa de probabilidade é que você pode reorganizar para que . Como existe um mínimo único em , o teste F é realmente o teste da razão de verossimilhança contra alternativas unilaterais à hipótese nula de distribuições idênticas.
Para executar o teste de razão de verossimilhança apropriado para uma alternativa de dois lados, você ainda pode usar a distribuição F; você simplesmente precisa encontrar o outro valor da razão da amostra significa para o qual a taxa de probabilidade é igual à da razão observada e . Para este exemplo, , & , fornecendo um valor p geral de (bastante próximo ao obtido pela aproximação do qui-quadrado para a distribuição do dobro da razão de verossimilhança log, ).rELR robs r E L R = 1,3272 Pr ( R > r E L R ) = 0,2142 0,4352 0,4315Pr(R>rELR) rELR=1.3272 Pr(R>rELR)=0.2142 0.4352 0.4315
Mas dobrar o valor p unicaudal é talvez a maneira mais comum de obter um valor p bicaudal: é equivalente a encontrar o valor da razão da amostra significa para o qual a probabilidade da cauda é igual a e depois encontra . Explicado dessa maneira, pode parecer estar colocando o carro à frente do cavalo para permitir que as probabilidades da cauda definam a extremidade de uma estatística de teste, mas pode ser justificado como sendo efetivamente dois testes de uma cauda (cada um o LRT) com várias comparações correção— & as pessoas geralmente estão interessadas em reivindicar que ou que Pr ( R > r E TrETP Pr(R< r o b s )Pr(R> R E T P ) μ x > μ y μ x < μ yPr(R>rETP) Pr(R<robs) Pr(R>rETP) μx>μy μx<μy μ x < μ yμx>μy ou . Também é menos barulhento e, mesmo para amostras de tamanho relativamente pequeno, fornece a mesma resposta que o LRT bicaudal adequado.μx<μy
O código R segue:
fonte