Minha situação é a seguinte: desejo, através de um estudo de Monte-Carlo, comparar valores- de dois testes diferentes para obter significância estatística de um parâmetro estimado (nulo é "sem efeito - parâmetro é zero" e a alternativa implícita é " parâmetro não é zero "). O teste A é o "teste t independente de duas amostras para igualdade de médias" , com variações iguais sob o valor nulo.
Teste B Eu me construí. Aqui, a distribuição nula usada é uma distribuição discreta genérica assimétrica . Mas encontrei o seguinte comentário em Rohatgi & Saleh (2001, 2ª ed., P. 462)
"Se a distribuição não é simétrica, o valor de não está bem definido no caso de dois lados, embora muitos autores recomendem duplicar o valor de um lado " .
Os autores não discutem mais isso, nem comentam a "sugestão de muitos autores" para dobrar o valor unilateral . (Isso cria a pergunta "o dobro do valor- de que lado? E por que esse lado e não o outro?)
Não pude encontrar nenhum outro comentário, opinião ou resultado sobre esse assunto. Entendo que com uma distribuição assimétrica, embora possamos considerar um intervalo simétrico em torno da hipótese nula em relação ao valor do parâmetro, não teremos a segunda simetria usual, a da alocação de massa em probabilidade. Mas não entendo por que isso torna o valor "não bem definido". Pessoalmente, usando um intervalo simétrico em torno da hipótese nula para os valores do estimador, não vejo definiçãoproblema em dizer "a probabilidade de que a distribuição nula produza valores iguais aos limites ou fora desse intervalo é XX". O fato de a massa de probabilidade, por um lado, ser diferente da massa de probabilidade, por outro lado, não parece causar problemas, pelo menos para os meus propósitos. Mas é mais provável que Rohatgi & Saleh saibam algo que eu não conheço.
Portanto, esta é a minha pergunta: em que sentido o valor- é (ou pode ser) "não bem definido" no caso de um teste bilateral, quando a distribuição nula não é simétrica?
Uma observação talvez importante: eu me aproximo mais do assunto no espírito dos pescadores, não estou tentando obter uma regra estrita de decisão no sentido Neyman-Pearson. Deixo ao usuário do teste o uso das informações do valor- juntamente com outras informações para fazer inferências.
fonte
Respostas:
Se olharmos para o teste exato de 2x2 e considerarmos essa a nossa abordagem, o que é "mais extremo" pode ser medido diretamente pela "menor probabilidade". (Agresti [1] menciona várias abordagens de vários autores para calcular valores p bicaudais apenas para este caso do teste exato de 2x2 Fisher, do qual essa abordagem é uma das três discutidas especificamente como 'mais populares'.)
Para uma distribuição contínua (unimodal), basta encontrar o ponto na outra cauda com a mesma densidade que o valor da amostra e tudo com probabilidade igual ou menor na outra cauda é contado no cálculo do valor-p.
Para distribuições discretas que são monotonicamente não crescentes nas caudas, é igualmente simples. Você apenas conta tudo com probabilidade igual ou inferior à sua amostra, que, dadas as suposições que adicionei (para fazer o termo "coroa" se encaixar na idéia), fornece uma maneira de resolvê-la.
Se você está familiarizado com os intervalos de HPD (e novamente, estamos lidando com a unimodalidade), é basicamente como tirar tudo de fora de um intervalo aberto de HPD que é delimitado de uma só vez pela estatística de sua amostra.
[Para reiterar - esta é uma probabilidade abaixo do nulo que estamos equiparando aqui.]
Então, pelo menos no caso unimodal, parece simples o suficiente para imitar o teste exato de Fisher e ainda falar sobre as duas caudas.
No entanto, você pode não ter pretendido invocar o espírito do teste exato de Fisher dessa maneira.
Então, pensando fora da idéia do que torna algo "como, ou mais extremo" por um momento, vamos seguir um pouco mais para o final das coisas de Neyman-Pearson. Pode ajudar (antes de você testar!) Definir a região de rejeição para um teste realizado em algum nível genérico (não quero dizer que você precise literalmente calcular uma, exatamente como você a calcularia). Assim que você fizer isso, a maneira de calcular dois valores de cauda para o seu caso deve se tornar óbvia.α
Essa abordagem pode ser valiosa mesmo se você estiver realizando um teste fora do teste da razão de verossimilhança usual. Para algumas aplicações, pode ser complicado descobrir como calcular valores-p em testes de permutação assimétricos ... mas muitas vezes se torna substancialmente mais simples se você pensar primeiro em uma regra de rejeição.
Com os testes F de variância, notei que o "valor p de cauda dupla" pode dar valores p bem diferentes ao que considero a abordagem correta. [Não importa qual grupo você chama de "amostra 1" ou se coloca a variação maior ou menor no numerador.]
[1]: Agresti, A. (1992),
Uma Pesquisa de Inferência Exata para Tabelas de Contingência
Statistical Science , vol. 7 , nº 1. (fev.), Pp. 131-153.
fonte
Um tipo de sequência desta resposta, discutindo alguns princípios de construção de testes nos quais a hipótese alternativa é explicitamente declarada, pode ser encontrada aqui .
para os valores p inferior e superior unilateral, o valor p bicaudal é dado por
fonte