Qual é a contrapartida bayesiana de um teste t de duas amostras com variações desiguais?

11

Estou procurando a contrapartida bayesiana do teste t de duas amostras com variações desiguais (o teste de Welch). Também estou procurando um teste multivariado, como a estatística T de Hotelling. Referências apreciadas.

Para o caso multivariado, suponha que temos e , em que (resp ) é um atalho para uma média da amostra, desvio padrão da amostra e número de pontos. Podemos assumir que o número de pontos é constante em todo o conjunto de dados, o desvio padrão é o mesmo para todos (resp ) e que as médias amostrais de (resp ) estão correlacionadas. Se você plotar os meios de amostra, eles se seguem e, conectando-os, você obtém uma função variável suave. Agora, em algumas partes, a função concorda com(y1,,yN)(z1,,zN)yiziyiziyiziyzfunção, mas em outros não, porque se torna grande. Eu gostaria de quantificar esta afirmação. mean(yi)mean(zi)std(yi)+std(zi)

yannick
fonte
Eu atualizei minha resposta.
John Salvatier
Digitar "behrens fisher" na caixa de pesquisa leva a informações valiosas sobre a abordagem bayesiana das duas amostras independentes com variações desiguais.
Stéphane Laurent

Respostas:

6

Embora você possa fazer isso de maneira bayesiana, você já pensou se seria realmente melhor estimar a diferença entre as médias, em vez de testar se elas são diferentes? É isso que Andrew Gelman recomenda frequentemente . Posso imaginar algumas razões possíveis para querer fazer testes de hipóteses, mas não acho que sejam tão comuns.

Eu não acho que você precise de algo como um teste t, porque você pode estimar bem o desvio padrão porque disse que os grupos têm desvios padrão muito semelhantes.

Se for esse o caso, acho que esse link deve ser o que você precisa. Ele mostra como estimar uma diferença de médias ou fazer um teste de hipótese (embora eu não recomende isso). Você também pode dar uma olhada na parte que eles fazem referência no livro de bolstad (você pode encontrar cópias eletrônicas on-line). É possível incorporar a estimativa das variações também, mas é mais complexo, então eu suspeito que você esteja melhor incorporando as informações anteriores que você possui sobre as variações de uma maneira ingênua (por exemplo, usando o estimador Stdev imparcial em cada um dos conjuntos e calcule a média e finja que esses são seus stdevs 'conhecidos').

John Salvatier
fonte
sim, mas isso leva a outro problema. Como você pode saber se a diferença nos meios é realmente significativa? Eu compararia com a soma do DP de cada amostra, mas isso não é muito rigoroso.
yannick
@yannick: "significativo", estatisticamente ou no mundo real?
Wayne
@Wayne mundo real, suponho.
yannick
3
@yannick: O significado do mundo real é um problema de conhecimento de domínio, não estatístico. Ou seja, posso dizer que tenho alguns dados de peso e há uma diferença estatisticamente significante de 10 gramas nos pesos médios entre dois grupos, no nível de 95%, mas isso tem significado no mundo real? Para um peixinho, sim, para homens adultos, não. Se você está falando do significado do mundo real, imagino que comparar com o SD ou determinar quantis responderia à sua pergunta mesmo que isso não pareça rigoroso e deixe espaço para alguém discordar de você.
Wayne
@Wayne Suponha que eu observe , você está dizendo que a decisão de quando podemos dizer o tamanho do efeito "significativo" é arbitrária? E assim é a escolha da função de link que mapeia essa quantidade para [0: 1]? Não existem coisas práticas que as pessoas fazem? m1m2s1+s2
yannick
12

John Kruschke desenvolveu uma rotina bayesiana que serve como uma queda no substituto do teste t de duas amostras. A rotina é chamada de BEST (Estimação Bayesiana Substitui o Teste T) e é descrita aqui . Também fiz uma versão javascript on-line que é executada no navegador disponível aqui .

Rasmus Bååth
fonte