Veja o caso das classificações de livros em um site. O Livro A é avaliado por 10.000 pessoas, com uma classificação média de 4,25 e a variação . Da mesma forma, o Livro B é avaliado por 100 pessoas e tem uma classificação de 4,5 com σ = 0,25 .
Agora, devido ao grande tamanho da amostra do Livro A, a "média estabilizou" para 4,25. Agora, para 100 pessoas, pode ser que, se mais pessoas lerem o Livro B, a classificação média caia para 4 ou 4,25.
- como interpretar a comparação de médias de diferentes amostras e quais são as melhores conclusões que podemos / devemos tirar?
Por exemplo - podemos realmente dizer que o Livro B é melhor que o Livro A.
t-test
mean
sample-size
Doutorado
fonte
fonte
Respostas:
Para esclarecer meu ponto de vista sobre poder, aqui está uma simulação muito simples escrita para R:
Eu penso nisso por analogia. Se você deseja conhecer a área de um retângulo e o perímetro é fixo, a área será maximizada se o comprimento e a largura forem iguais (ou seja, se o retângulo for um quadrado ). Por outro lado, à medida que o comprimento e a largura divergem (à medida que o retângulo fica alongado), a área diminui.
fonte
set.seed()
função garantirá que você obtenha saída idêntica. Deixe-me saber se ainda é muito difícil de seguir.Além da resposta mencionada por @gung, referindo-o ao teste t, parece que você pode estar interessado nos sistemas de classificação bayesiana (por exemplo, aqui está uma discussão ). Os sites podem usar esses sistemas para classificar itens de pedidos que variam no número de votos recebidos. Essencialmente, esses sistemas funcionam atribuindo uma classificação composta pela classificação média de todos os itens mais a média da amostra de classificações para o objeto específico. À medida que o número de classificações aumenta, o peso atribuído à média do objeto aumenta e o peso atribuído à classificação média de todos os itens diminui. Talvez verifique as médias bayesianas .
É claro que as coisas podem ficar muito mais complexas à medida que você lida com uma ampla gama de questões, como fraude no voto, alterações ao longo do tempo etc.
fonte