Estou lendo os slides "Doing Bayesian Data Analysis" de John Kruschke , mas na verdade tenho uma pergunta sobre sua interpretação dos testes t e / ou toda a estrutura de testes de significância de hipóteses nulas. Ele argumenta que os valores de p estão mal definidos porque dependem das intenções do investigador.
Em particular, ele fornece um exemplo (páginas 3-6) de dois laboratórios que coletam conjuntos de dados idênticos comparando dois tratamentos. Um laboratório compromete-se a coletar dados de 12 indivíduos (6 por condição), enquanto o outro coleta dados por um período fixo, o que também gera 12 indivíduos. De acordo com os slides, o valor crítico para difere entre esses dois esquemas de coleta de dados: para o primeiro, mas para o último !t crit = 2,33 t crit = 2,45
Uma postagem no blog - que agora não consigo encontrar - sugeriu que o cenário de duração fixa tem mais graus de liberdade, pois eles poderiam ter coletado dados de 11, 13 ou qualquer outro número de assuntos, enquanto o cenário de N fixo, por definição, tem .
Alguém poderia me explicar:
Por que o valor crítico diferiria entre essas condições?
(Supondo que seja um problema) Como alguém corrige / compara os efeitos de diferentes critérios de parada?
Eu sei que definir os critérios de parada com base na significância (por exemplo, amostra até ) pode aumentar as chances de um erro do tipo I, mas isso não parece estar acontecendo aqui, pois nenhuma regra de parada depende do resultado de a análise.
fonte
Finalmente, localizei o artigo associado aos slides: Kruschke (2010) , também disponível diretamente do autor (via CiteSeerX) aqui , uma vez que a revista não é amplamente veiculada. A explicação é um pouco prosaica, mas ainda não tenho certeza se a comprei.
No caso de N fixo, o valor crítico é calculado da seguinte forma: as amostras são coletadas aleatoriamente da (mesma) população e um valor é calculado. Esse processo é repetido várias vezes para criar uma distribuição nula. Finalmente, está definido como o percentil 95 dessa distribuição.2 N t t c r i tt 2 N t tc r i t
Para o caso de duração fixa, ele assume que os sujeitos chegam a uma taxa média . A distribuição nula é construída repetindo duas etapas. Na primeira etapa, o número de sujeitos para cada condição e é obtido de uma distribuição de posses com o parâmetro . Em seguida, os sorteios e aleatórios da população são usados para calcular um valor . Isso é repetido várias vezes e é definido como o percentil 95 dessa distribuição.N 1 N 2 λ N 1 N 2 t t c r i tλ N1 N2 λ N1 N2 t tc r i t
Isso parece um pouco ... atrevido ... para mim. Pelo que entendi, não há uma única distribuição ; em vez disso, é uma família de distribuições, com uma forma parcialmente determinada pelo parâmetro graus de liberdade. Para a condição fixa , existem sujeitos por grupo e o valor apropriado para um teste t não pareado é aquele com graus de liberdade, que é provavelmente o que sua simulação reproduz. N N t 2 N - 2t N N t 2 N- 2
Na outra condição, parece que a distribuição tipo " " é na verdade uma combinação de amostras de muitas distribuições diferentes , dependendo dos desenhos específicos. Ao definir , é possível obter os graus médios de liberdade iguais a , mas isso não é suficiente. Por exemplo, a média das distribuições para e não parece ser a distribuição com 3 graus de liberdade.t λ = N 2 N - N t ν = 1 ν = 5 tt t λ = N 2 N- N t ν=1 ν=5 t
Em suma:
fonte