Estou tentando testar o nulo , em relação à alternativa local , para uma variável aleatória , sujeita a inclinação leve a média e curtose da variável aleatória. Seguindo as sugestões de Wilcox em 'Introdução à estimativa robusta e testes de hipóteses', observei os testes com base na média aparada, na mediana e no estimador M de localização (procedimento de "uma etapa" de Wilcox). Esses testes robustos superam o teste t padrão, em termos de potência, ao testar com uma distribuição que não é distorcida, mas leptokurtótica.
No entanto, ao testar com uma distribuição inclinada, esses testes unilaterais são muito liberais ou conservadores demais sob a hipótese nula, dependendo se a distribuição é inclinada para a esquerda ou para a direita, respectivamente. Por exemplo, com 1000 observações, o teste com base na mediana realmente rejeitará ~ 40% das vezes, no nível nominal de 5%. A razão para isso é óbvia: para distribuições distorcidas, a mediana e a média são bastante diferentes. No entanto, na minha inscrição, eu realmente preciso testar a média, não a mediana, não a média aparada.
Existe uma versão mais robusta do teste t que efetivamente testa a média, mas é imune a distorções e curtose?
Idealmente, o procedimento funcionaria bem também no caso de não-inclinação e alta curtose. O teste de "uma etapa" é quase bom o suficiente, com o parâmetro "dobra" definido relativamente alto, mas é menos poderoso que os testes de média aparada quando não há inclinação e tem alguns problemas para manter o nível nominal de rejeições sob inclinação .
background: o motivo pelo qual realmente me preocupo com a média, e não a mediana, é que o teste seria usado em um aplicativo financeiro. Por exemplo, se você quiser testar se um portfólio teve retornos de log esperados positivos, a média é realmente apropriada, porque se você investir no portfólio, experimentará todos os retornos (que são os tempos médios do número de amostras), em vez de duplicatas da mediana. Isto é, eu realmente se preocupam com a soma de extrai da RV .
fonte
Respostas:
Por que você está analisando testes não paramétricos? As suposições do teste t são violadas? Ou seja, dados ordinais ou não normais e variações inconstantes? Obviamente, se sua amostra for grande o suficiente, você poderá justificar o teste t paramétrico com maior poder, apesar da falta de normalidade na amostra. Da mesma forma, se sua preocupação é com variações desiguais, há correções no teste paramétrico que produzem valores p precisos (a correção de Welch).
Caso contrário, comparar seus resultados com o teste t não é uma boa maneira de fazer isso, porque os resultados do teste t são tendenciosos quando as suposições não são atendidas. O Mann-Whitney U é uma alternativa não-paramétrica apropriada, se é isso que você realmente precisa. Você só perde energia se estiver usando o teste não paramétrico quando puder justificadamente usar o teste t (porque as premissas são atendidas).
E, apenas para um pouco mais de fundo, vá aqui ...
http://www.jerrydallal.com/LHSP/STUDENT.HTM
fonte
Concordo que, se você deseja realmente testar se as médias do grupo são diferentes (em vez de testar diferenças entre medianas do grupo ou médias aparadas, etc.), não deseja usar um teste não paramétrico que teste uma hipótese diferente.
Em geral, os valores de p de um teste t tendem a ser razoavelmente precisos, dadas as partidas moderadas da suposição de normalidade dos resíduos. Confira este applet para obter uma intuição sobre essa robustez: http://onlinestatbook.com/stat_sim/robustness/index.html
Se você ainda está preocupado com a violação da suposição de normalidade, pode querer iniciar . por exemplo, http://biostat.mc.vanderbilt.edu/wiki/pub/Main/JenniferThompson/ms_mtg_18oct07.pdf
Você também pode transformar a variável dependente inclinada para resolver problemas com desvios da normalidade.
fonte
trimpb
etrimcibt
, mas eles são um pouco lentos para fazer meus testes de energia, pelo menos para o meu gosto. re: 3, eu tinha pensado nesse método, mas estou interessado na média dos dados não transformados (ou seja, não estou comparando 2 RVs com um teste t; nesse caso, uma transformação monotônica seria adequada para uma comparação baseada em classificação, como observado por @JoFrhwld).O 'mais recente e o melhor' é devido a Ogaswara , com referências a Hall e outros.
fonte
Não tenho reputação suficiente para comentar, portanto, como resposta: dê uma olhada nessa cálculo. Eu acho que isso fornece uma excelente resposta. Em resumo:
fonte