Tenho duas proporções (por exemplo, taxa de cliques (CTR) em um link em um layout de controle e CTR em um link em um layout experimental) e quero calcular um intervalo de confiança de 95% em torno da proporção dessas proporções.
Como eu faço isso? Eu sei que posso usar o método delta para calcular a variação dessa proporção, mas não tenho certeza do que fazer além disso. O que devo usar como ponto médio do intervalo de confiança (minha taxa observada ou a taxa esperada diferente) e quantos desvios padrão em torno dessa taxa devo tomar?
Devo estar usando a variação do método delta? (Eu realmente não me importo com a variação, apenas um intervalo de confiança.) Devo usar o Teorema de Fieller , usando o Caso 1 (já que estou fazendo proporções, acho que satisfaz o requisito de distribuição normal)? Devo apenas calcular uma amostra de bootstrap?
fonte
Respostas:
A maneira padrão de fazer isso em epidemiologia (em que uma proporção de proporções é geralmente chamada de razão de risco ) é primeiro transformar a razão por log, calcular um intervalo de confiança na escala de log usando o método delta e assumindo uma distribuição normal, então volte a transformar. Isso funciona melhor em tamanhos moderados de amostra do que o método delta na escala não transformada, embora ainda se comporte mal se o número de eventos em ambos os grupos for muito pequeno e falhe completamente se não houver eventos em nenhum dos grupos.
Se existirem e x 2 sucessos nos dois grupos em cada totais n 1 e n 2 , então a estimativa óbvio para o rácio de proporções é θ = x 1 / n 1x1 x2 n1 n2
Usando o método de delta e assumindo que os dois grupos são independentes e os êxitos são binomial distribuído, é possível mostrar que Tomando a raiz quadrada dessa dá o erro padrão SE ( log θ ) . Partindo do princípio de que o log θ é normalmente distribuída, um intervalo de confiança de 95% para o log θ
fonte