Imagine que você tenha um estudo com dois grupos (por exemplo, homens e mulheres) observando uma variável dependente numérica (por exemplo, resultados de testes de inteligência) e tenha a hipótese de que não há diferenças entre os grupos.
Questão:
- Qual é uma boa maneira de testar se não há diferenças de grupo?
- Como você determinaria o tamanho da amostra necessário para testar adequadamente se não há diferenças de grupo?
Pensamentos iniciais:
- Não seria suficiente fazer um teste t padrão porque uma falha na rejeição da hipótese nula não significa que o parâmetro de interesse seja igual ou próximo de zero; este é particularmente o caso de pequenas amostras.
- Eu poderia examinar o intervalo de confiança de 95% e verificar se todos os valores estão dentro de um intervalo suficientemente pequeno; talvez mais ou menos 0,3 desvios padrão.
hypothesis-testing
t-test
equivalence
tost
Jeromy Anglim
fonte
fonte
Respostas:
Eu acho que você está perguntando sobre o teste de equivalência . Basicamente, você precisa decidir qual é a diferença aceitável para concluir ainda que os dois grupos são efetivamente equivalentes. Essa decisão define os limites do intervalo de confiança de 95% (ou outro) e os cálculos do tamanho da amostra são feitos com base nisso.
Há um livro inteiro sobre o assunto.
Um "equivalente" clínico muito comum dos testes de equivalência é um teste / julgamento de não inferioridade . Nesse caso, você "prefere" um grupo ao outro (um tratamento estabelecido) e projeta seu teste para mostrar que o novo tratamento não é inferior ao tratamento estabelecido em algum nível de evidência estatística.
Acho que preciso dar crédito a Harvey Motulsky pelo site GraphPad.com (em "Biblioteca" ).
fonte
Além da possibilidade já mencionada de algum tipo de teste de equivalência , dos quais a maioria deles, até onde eu sei, é roteada principalmente na boa e velha tradição freqüentista, existe a possibilidade de realizar testes que realmente fornecem uma quantificação de evidências. a favor de hipóteses nulas, nomeadamente testes bayesianos .
Uma implementação de um teste t bayesiano pode ser encontrada aqui: Wetzels, R., Raaijmakers, JGW, Jakab, E. & Wagenmakers, E.-J. (2009). Como quantificar o suporte a favor e contra a hipótese nula: Uma implementação flexível do WinBUGS de um teste t bayesiano padrão. Psychonomic Bulletin & Review, 16, 752-760.
Há também um tutorial sobre como fazer tudo isso no R:
http://www.ruudwetzels.com/index.php?src=SDtest
Uma alternativa (talvez uma abordagem mais moderna) de um teste t bayesiano é fornecida (com código) neste artigo por Kruschke:
Kruschke, JK (2013). A estimativa bayesiana substitui o teste t . Journal of Experimental Psychology: General , 142 (2), 573-603. doi: 10.1037 / a0029146
Todos os adereços para esta resposta (antes da adição de Kruschke) devem ser enviados ao meu colega David Kellen. Eu roubei a resposta dele dessa pergunta .
fonte
Seguindo a resposta de Thylacoleo, fiz uma pequena pesquisa.
O pacote de equivalência em R tem a
tost()
funçãoVeja Robinson e Frose (2004) " Validação de modelo usando testes de equivalência " para obter mais informações.
fonte
equivalence
pacote.Sei que existem alguns documentos que podem ser úteis para você:
Tryon, WW (2001). Avaliando diferença estatística, equivalência e indeterminação usando intervalos de confiança inferenciais: Um método alternativo integrado de realização de testes estatísticos de hipóteses nulas. Psychological Methods, 6, 371-386. ( PDF GRATUITO )
E uma correção:
Tryon, WW, & Lewis, C. (2008). Um método de intervalo de confiança inferencial para estabelecer equivalência estatística que corrige o fator de redução de Tryon (2001). Psychological Methods, 13, 272-278. ( PDF GRATUITO )
Além disso:
Seaman, MA e Serlin, RC (1998). E intervalos de confiança quivalence para comparações de dois grupos de meios . Psychological Methods, Vol. 3 (4), 403-411.
fonte
Recentemente, pensei em uma maneira alternativa de "teste de equivalência" com base na distância entre as duas distribuições e não entre suas médias.
Existem alguns métodos que fornecem intervalos de confiança para a sobreposição de duas distribuições gaussianas:
fonte
Nas ciências médicas, é preferível usar uma abordagem de intervalo de confiança em oposição a dois testes unilaterais (tost). Também recomendo representar graficamente as estimativas pontuais, os ICs e as margens de equivalência pré-determinadas para deixar as coisas muito claras.
Sua pergunta provavelmente seria abordada por essa abordagem.
As diretrizes do CONSORT para estudos de não inferioridade / equivalência são bastante úteis nesse sentido.
Veja Piaggio G, Elbourne DR, Altman DG, Pocock SJ, Evans SJ e CONSORT Group. Relato de ensaios randomizados de não inferioridade e equivalência: uma extensão da declaração CONSORT. JAMA. 8 de março de 2006; 295 (10): 1152-60. (Link para o texto completo.)
fonte
Sim. Este é um teste de equivalência. Basicamente, você inverte a hipótese nula e alternativa e baseia o tamanho da amostra no poder para mostrar que a diferença dos meios está dentro da janela de equivalência. Blackwelder chamou de "Provando a hipótese nula". Isso geralmente é feito em ensaios clínicos farmacêuticos em que a equivalência de um medicamento genérico ao medicamento comercializado é testada ou um medicamento aprovado é comparado a uma nova formulação (geralmente chamada de bioequivalência). A versão unilateral é chamada de não inferioridade. Algumas vezes, um medicamento pode ser aprovado apenas mostrando que o novo medicamento não é inferior ao concorrente comercializado. Shao e Pigeot desenvolveram uma abordagem consistente de autoinicialização para a bioequivalência usando desenhos de crossover.
fonte
Diferenças de inicialização (por exemplo, a diferença entre as médias) entre os 2 grupos da amostra e verifique a significância estatística. Uma descrição mais detalhada dessa abordagem, embora em um contexto diferente, pode ser encontrada aqui http://www.automated-trading-system.com/a-different-application-of-the-bootstrap/
fonte