Estamos testando uma campanha de marketing por email. Em nosso teste inicial, enviamos dois tipos de email diferentes e tivemos um terceiro grupo de controle que não recebeu um email. Agora estamos recuperando "resultados" como proporção de usuários que retornaram ao nosso aplicativo. Aqui estão os resultados:
Group | received e-mail | returned | %-returned
A | 16,895 | 934 | 5.53%
B | 17,530 | 717 | 4.09%
C | 42408 | 1618 | 3.82%
Parece que o Grupo A pode realmente ser melhor que B e C, mas qual é o teste adequado para mostrar isso?
Respostas:
Em uma tabela como essa, você pode particionar a estatística G produzida por um teste G, em vez de calcular os ORs ou executar uma regressão logística. Embora você tenha que decidir como particioná-lo. Aqui, a estatística G, que é semelhante ao X ^ 2 de Pearson e também segue uma distribuição X ^ 2, é:
G = 2 * soma (OBS * ln (OBS / EXP)).
Você primeiro calcula isso para a tabela geral, neste caso: G = 76,42, em 2 df, o que é altamente significativo (p <0,0001). Ou seja, a taxa de retorno depende do grupo (A, B ou C).
Então, como você tem 2 df, é possível executar dois testes G menores, de 1 df (2x2). Depois de executar o primeiro, no entanto, você deve recolher as linhas dos dois níveis usados no primeiro teste e, em seguida, usar esses valores para testá-los no terceiro nível. Aqui, digamos que você teste B contra C primeiro.
Isso produz um G-stat de 2,29 em 1 df, o que não é significativo (p = 0,1300). Em seguida, faça uma nova tabela, combinando as linhas B e C. Agora teste A contra B + C.
Isso produz um G-stat de 74,13, em 1 df, o que também é altamente significativo (p <0,0001).
Você pode verificar seu trabalho adicionando as duas estatísticas de teste menores, que devem ser iguais à estatística de teste maior. Faz: 2,29 + 74,13 = 76,42
A história aqui é que seus grupos B e C não são significativamente diferentes, mas esse grupo A tem uma taxa de retorno mais alta do que B e C combinados.
Espero que ajude!
Você também pode ter particionado o G-stat de maneira diferente comparando A a B primeiro, depois C com A + B, ou comparando A com C, depois B com A + C. Além disso, você pode expandir isso para 4 ou mais grupos, mas após cada teste, você deve recolher as duas linhas que você acabou de testar, com um número máximo de testes igual ao df na tabela original. Existem outras maneiras de particionar com tabelas mais complicadas. O livro de Agresti, "Análise de dados categóricos", deve conter os detalhes. Especificamente, seu capítulo sobre inferência para tabelas de contingência bidirecional.
fonte
Simplesmente calcularia as razões de chances (ou risco) entre o grupo A e B, entre B e C e entre A e C e ver se elas estatisticamente diferentes. Não vejo uma razão para fazer um teste de proporções "omnibus" neste caso, pois você tem apenas três grupos. Três testes de qui-quadrado também podem funcionar.
Como alguns dos indivíduos destacaram nos comentários abaixo, a regressão logística com contrastes planejados também funcionaria bem.
fonte