Quando fazemos testes, acabamos com dois resultados.
1) Rejeitamos hipóteses nulas
2) Falhamos em rejeitar a hipótese nula.
Não falamos em aceitar hipóteses alternativas. Se não falamos em aceitar hipóteses alternativas, por que precisamos ter hipóteses alternativas?
Aqui está a atualização: Alguém poderia me dar dois exemplos:
1) rejeitar hipótese nula é igual a aceitar hipótese alternativa
2) rejeitar hipótese nula não é igual a aceitar hipótese alternativa
hypothesis-testing
user1700890
fonte
fonte
Respostas:
Vou me concentrar em "Se não falamos em aceitar hipóteses alternativas, por que precisamos ter hipóteses alternativas?"
Porque nos ajuda a escolher uma estatística de teste significativa e projetar nosso estudo para ter alto poder - uma grande chance de rejeitar o nulo quando a alternativa for verdadeira. Sem uma alternativa, não temos conceito de poder.
Imagine que temos apenas uma hipótese nula e nenhuma alternativa. Então não há orientação sobre como escolher uma estatística de teste que terá alta potência. Tudo o que podemos dizer é: "Rejeite o nulo sempre que observar uma estatística de teste cujo valor é improvável sob o nulo". Podemos escolher algo arbitrário: podemos desenhar números aleatórios Uniform (0,1) e rejeitar o nulo quando estiverem abaixo de 0,05. Isso acontece sob o nulo "raramente", não mais do que 5% das vezes - mas também é tão raro quando o nulo é falso. Portanto, este é tecnicamente um teste estatístico, mas não tem sentido como evidência a favor ou contra qualquer coisa.
Em vez disso, geralmente temos alguma hipótese alternativa cientificamente plausível ( "Não é uma diferença positiva nos resultados entre os grupos de tratamento e controle da minha experiência"). Gostaríamos de defendê-lo contra potenciais críticos que apresentariam a hipótese nula como advogados do diabo ("Ainda não estou convencido - talvez o seu tratamento realmente dói, ou não tenha nenhum efeito , e qualquer diferença aparente no os dados são devidos apenas à variação da amostra ").
Com essas duas hipóteses em mente, agora podemos configurar um teste poderoso , escolhendo uma estatística de teste cujos valores típicos sob a alternativa sejam improváveis sob nulo. (Uma estatística t positiva de 2 amostras longe de 0 não seria surpreendente se a alternativa for verdadeira, mas surpreendente se o nulo for verdadeiro.) Em seguida, calculamos a distribuição da amostra da estatística de teste sob o nulo, para que possamos calcular os valores de p --- e interpretá-los. Quando observamos uma estatística de teste improvável sob o valor nulo, especialmente se o desenho do estudo, o tamanho da amostra etc. foi escolhido para ter alta potência , isso fornece algumas evidências para a alternativa.
Então, por que não falamos em "aceitar" a hipótese alternativa? Porque mesmo um estudo de alta potência não fornece prova completamente rigorosa de que o nulo está errado. Ainda é um tipo de evidência, mas mais fraca do que alguns outros tipos de evidência.
fonte
Historicamente, houve discordância sobre se uma hipótese alternativa era necessária. Deixe-me explicar esse ponto de discordância, considerando as opiniões de Fisher e Neyman, dentro do contexto das estatísticas freqüentistas, e uma resposta bayesiana.
fonte
Não tenho 100% de certeza se esse é um requisito formal, mas geralmente a hipótese nula e a hipótese alternativa são: 1) complementares e 2) exaustivas. Ou seja: 1) eles não podem ser ambos verdadeiros ao mesmo tempo; 2) se um não é verdadeiro, o outro deve ser verdadeiro.
fonte
Em um teste de hipóteses clássico, o único papel matemático desempenhado pela hipótese alternativa é que ela afeta a ordem das evidências por meio da estatística de teste escolhida. A hipótese alternativa é usada para determinar a estatística de teste apropriada para o teste, o que equivale a definir uma classificação ordinal de todos os resultados de dados possíveis, dos mais conducentes à hipótese nula (contra a alternativa declarada) aos menos conducentes às hipóteses nulas. (contra a alternativa indicada). Depois de formar esse ranking ordinal dos possíveis resultados dos dados, a hipótese alternativa não desempenha mais nenhum papel matemático no teste .
Essa função de valor p determina totalmente as evidências no teste para qualquer vetor de dados. Quando combinado com um nível de significância escolhido, determina o resultado do teste para qualquer vetor de dados. (Nós descrevemos isso para um número fixo de pontos de dados mas isso pode ser facilmente estendido para permitir arbitrários .) É importante observar que o valor de p é afetado pela estatística do teste somente através da escala ordinal que ele induzn n , portanto, se você aplicar uma transformação monotonicamente crescente às estatísticas de teste, isso não fará diferença no teste de hipótese (ou seja, é o mesmo teste). Essa propriedade matemática reflete apenas o fato de que o único objetivo da estatística de teste é induzir uma escala ordinal no espaço de todos os vetores de dados possíveis, para mostrar quais são mais propícios para a alternativa nula.
A hipótese alternativa afeta essa medida somente através da funçãoT , que é escolhida com base nas hipóteses nulas e alternativas declaradas no modelo geral. Portanto, podemos considerar a função estatística de teste como sendo uma função do modelo geral e as duas hipóteses. Por exemplo, para um teste de razão de verossimilhança, a estatística de teste é formada tomando uma razão (ou logaritmo de uma razão) de supremos da função de verossimilhança em intervalos de parâmetros relacionados às hipóteses nulas e alternativas.T≡g(M,H0,HA) M
O que isso significa se compararmos testes com diferentes alternativas? Suponha que você tenha um modelo fixo e deseje fazer dois testes de hipótese diferentes comparando a mesma hipótese nula com duas alternativas diferentes e . Nesse caso, você terá duas funções estatísticas de teste diferentes:M H0 HA H′A
levando às funções de valor p correspondentes:
É importante observar que, se e são transformações monotônicas crescentes uma da outra, as funções de valor e são idênticas, portanto, ambos os testes são o mesmo teste. Se as funções e não são transformações monotônicas crescentes uma da outra, então temos dois testes de hipótese genuinamente diferentes.T T′ p p′ T T′
fonte
A razão pela qual eu não pensaria em aceitar a hipótese alternativa é porque não é isso que estamos testando. O teste de significância de hipótese nula (NHST) calcula a probabilidade de observar dados tão extremos quanto observado (ou mais), considerando que a hipótese nula é verdadeira ou, em outras palavras, o NHST calcula um valor de probabilidade condicionado ao fato de que a hipótese nula é verdadeira , . Portanto, é a probabilidade dos dados assumirem que a hipótese nula é verdadeira. Ele nunca usa ou fornece a probabilidade de uma hipótese (nem nula nem alternativa). Portanto, quando você observa um pequeno valor p, tudo que você sabe é que os dados que você observou parecem improváveis emP(data|H0) H0 , então você está coletando evidências contra o nulo e a favor de qualquer que seja sua explicação alternativa.
Antes de executar o experimento, você pode decidir sobre um nível de corte ( ) que considere significativo, ou seja, se o valor de p cair abaixo desse nível, você conclui que a evidência contra o nulo é tão esmagadoramente alta que o os dados devem ter se originado de algum outro processo de geração de dados e você rejeita a hipótese nula com base nessa evidência. Se o valor-p estiver acima desse nível, você falha em rejeitar a hipótese nula, pois sua evidência não é substancial o suficiente para acreditar que sua amostra veio formar um processo diferente de geração de dados.α
A razão pela qual você formula uma hipótese alternativa é porque provavelmente teve um experimento em mente antes de começar a amostrar. A formulação de uma hipótese alternativa também pode decidir se você usa um teste de uma ou duas caudas e, portanto, fornece mais poder estatístico (no cenário de uma cauda). Mas tecnicamente, para executar o teste, você não precisa formular uma hipótese alternativa, apenas os dados.
fonte