Eu tenho duas amostras ( em ambos os casos). Os meios diferem cerca de duas vezes o valor padrão. dev. O valor resultante é de aproximadamente 10. Embora seja ótimo saber que mostrei conclusivamente que os meios não são os mesmos, isso me parece ser impulsionado pelo grande n. Olhando para os histogramas dos dados, certamente não acho que valor de p pequeno seja realmente representativo dos dados e, para ser sincero, não me sinto à vontade para citá-los. Provavelmente estou fazendo a pergunta errada. O que estou pensando é: ok, os meios são diferentes, mas isso realmente importa, pois as distribuições compartilham uma sobreposição significativa?
É aqui que o teste bayesiano é útil? Nesse caso, onde é um bom lugar para começar, um pouco de pesquisa no Google não resultou em nada útil, mas talvez eu não faça a pergunta certa. Se isso é errado, alguém tem alguma sugestão? Ou isso é simplesmente um ponto de discussão em oposição à análise quantitativa?
fonte
Respostas:
Seja denotar a média da primeira população e µ 2 denotar a média da segunda população. Parece que você usou um teste t de duas amostras para testar se µ 1 = µ 2 . O resultado significativo implica que μ 1 ≠ μ 2 , mas a diferença parece ser a pequeno para a matéria para a sua aplicação.μ1 μ2 t μ1=μ2 μ1≠μ2
O que você encontrou foi o fato de que estatisticamente significativo geralmente pode ser algo além de significativo para o aplicativo . Embora a diferença possa ser estatisticamente significativa, ainda pode não ser significativa .
Os testes bayesianos não resolverão esse problema - você ainda concluirá que existe uma diferença.
No entanto, pode haver uma saída. Por exemplo, para uma hipótese unilateral, você pode decidir que se for Δ unidades maiores que µ 2 , isso seria uma diferença significativa que seja grande o suficiente para importar para a sua aplicação.μ1 Δ μ2
Nesse caso, você testaria se vez de se μ 1 - μ 2 = 0 . A estatística t (assumindo variações iguais) nesse caso seria T = ˉ x 1 - ˉ x 2 - Δμ1−μ2≤Δ μ1−μ2=0 t
quespé a estimativa do desvio padrão combinado. Sob a hipótese nula, essa estatística ét-distribuída comn1+n2-2graus de liberdade.
Uma maneira fácil de realizar este teste é subtrair de suas observações a partir da primeira população e, em seguida, realizar um regular unilateral de duas amostras t -teste.Δ t
fonte
É válido comparar várias abordagens, mas não com o objetivo de escolher aquela que favorece nossos desejos / crenças.
Minha resposta para sua pergunta é: É possível que duas distribuições se sobreponham enquanto elas têm meios diferentes, o que parece ser o seu caso (mas precisaríamos ver seus dados e contexto para fornecer uma resposta mais precisa).
Vou ilustrar isso usando algumas abordagens para comparar meios normais .
1. testet
Considere duas amostras simuladas do tamanho de um N ( 10 , 1 ) e N ( 12 , 1 ) ; o valor t é aproximadamente 10, como no seu caso (consulte o código R abaixo).70 N(10,1) N(12,1) t 10
No entanto, as densidades mostram uma considerável sobreposição. Mas lembre-se de que você está testando uma hipótese sobre as médias, que neste caso são claramente diferentes, mas, devido ao valor de , há uma sobreposição das densidades.σ
2. Probabilidade de perfil deμ
Para uma definição da probabilidade e probabilidade do perfil, consulte 1 e 2 .
Para os dados simulados, estes podem ser calculados em R da seguinte maneira
O posterior deμ para cada conjunto de dados pode ser calculado da seguinte forma
Novamente, os intervalos de credibilidade para os meios não se sobrepõem em nenhum nível razoável.
Em conclusão, você pode ver como todas essas abordagens indicam uma diferença significativa de médias (que é o principal interesse), apesar da sobreposição das distribuições.
A julgar pelas suas preocupações sobre a sobreposição das densidades, outra quantidade de interesse pode serP (X< Y) , a probabilidade de a primeira variável aleatória ser menor que a segunda variável. Essa quantidade pode ser estimada não parametricamente, como nesta resposta . Observe que não há premissas distributivas aqui. Para os dados simulados, esse estimador é0.8823825 , mostrando alguma sobreposição nesse sentido, enquanto os meios são significativamente diferentes. Por favor, dê uma olhada no código R mostrado abaixo.
Eu espero que isso ajude.
fonte
Respondendo à pergunta certa
Qualquer teste que pergunte se os meios de grupo são diferentes, quando funcionar corretamente, informará se os meios são diferentes. Não informará que as distribuições dos dados em si são diferentes, pois essa é uma pergunta diferente. Essa pergunta certamente depende de se os meios são diferentes, mas também de muitas outras coisas que podem ser (incompletamente) resumidas como variação, inclinação e curtose.
Você nota corretamente que a certeza de onde estão os meios depende da quantidade de dados que você precisa para estimar, portanto, ter mais dados permitirá identificar diferenças médias em distribuições mais próximas. Mas você quer saber se
Na verdade, não é, pelo menos não diretamente. E isso é por design. É representativo (aproximadamente falando) da certeza de que um determinado par de estatísticas de amostra dos dados (não os dados em si) são diferentes.
Se você deseja representar os dados em si de uma maneira mais formal do que simplesmente mostrar os histogramas e os momentos de teste, talvez um par de gráficos de densidade possa ser útil. Em vez disso, depende realmente do argumento que você está usando o teste.
Uma versão bayesiana
Sob todos esses aspectos, os "testes" e os testes T das diferenças bayesianas se comportarão da mesma maneira, porque eles estão tentando fazer a mesma coisa. As únicas vantagens em que posso pensar em usar uma abordagem bayesiana são: a) que será fácil fazer o teste permitindo possíveis variações diferentes para cada grupo eb) que ele se concentrará na estimativa do tamanho provável da diferença de médias em vez de encontrar um valor-p para algum teste de diferença. Dito isto, essas vantagens são bem menores: por exemplo, em b) você sempre pode relatar um intervalo de confiança para a diferença.
As aspas acima sobre 'testes' são deliberadas. Certamente é possível fazer testes de hipóteses bayesianas, e as pessoas fazem. No entanto, eu sugeriria que a vantagem comparativa da abordagem está no foco na construção de um modelo plausível dos dados e na comunicação de seus aspectos importantes com níveis adequados de incerteza.
fonte
Antes de tudo, isso não é um problema para se colocar em testes freqüentes. O problema está na hipótese nula de que os meios são exatamente iguais. Portanto, se as populações diferem em média por qualquer quantidade pequena e o tamanho da amostra é grande o suficiente, a chance de rejeitar essa hipótese nula é muito alta. Portanto, o valor de p para o seu teste acabou sendo muito pequeno. O culpado é a escolha da hipótese nula. Escolha d> 0 e assuma a hipótese nula de que as médias diferem menos que d no valor absoluto menos que d. Você escolhe d para que a diferença real tenha que ser satisfatoriamente grande para rejeitar. Seu problema desaparece. O teste bayesiano não resolve o seu problema se você insistir em uma hipótese nula de igualdade exata de médias.
fonte