Teste t robusto para média

17

Estou tentando testar o nulo , em relação à alternativa local , para uma variável aleatória , sujeita a inclinação leve a média e curtose da variável aleatória. Seguindo as sugestões de Wilcox em 'Introdução à estimativa robusta e testes de hipóteses', observei os testes com base na média aparada, na mediana e no estimador M de localização (procedimento de "uma etapa" de Wilcox). Esses testes robustos superam o teste t padrão, em termos de potência, ao testar com uma distribuição que não é distorcida, mas leptokurtótica.E[X]=0E[X]>0X

No entanto, ao testar com uma distribuição inclinada, esses testes unilaterais são muito liberais ou conservadores demais sob a hipótese nula, dependendo se a distribuição é inclinada para a esquerda ou para a direita, respectivamente. Por exemplo, com 1000 observações, o teste com base na mediana realmente rejeitará ~ 40% das vezes, no nível nominal de 5%. A razão para isso é óbvia: para distribuições distorcidas, a mediana e a média são bastante diferentes. No entanto, na minha inscrição, eu realmente preciso testar a média, não a mediana, não a média aparada.

Existe uma versão mais robusta do teste t que efetivamente testa a média, mas é imune a distorções e curtose?

Idealmente, o procedimento funcionaria bem também no caso de não-inclinação e alta curtose. O teste de "uma etapa" é quase bom o suficiente, com o parâmetro "dobra" definido relativamente alto, mas é menos poderoso que os testes de média aparada quando não há inclinação e tem alguns problemas para manter o nível nominal de rejeições sob inclinação .

background: o motivo pelo qual realmente me preocupo com a média, e não a mediana, é que o teste seria usado em um aplicativo financeiro. Por exemplo, se você quiser testar se um portfólio teve retornos de log esperados positivos, a média é realmente apropriada, porque se você investir no portfólio, experimentará todos os retornos (que são os tempos médios do número de amostras), em vez de duplicatas da mediana. Isto é, eu realmente se preocupam com a soma de extrai da RV .nnX

shabbychef
fonte
Existe algum motivo que proíba o uso do teste t Welch? Dê uma olhada na minha resposta a esta pergunta ( stats.stackexchange.com/questions/305/… ), onde me refiro a um artigo que defende o uso de Welch em caso de não normalidade e heterocedasticidade.
Henrik
1
bem, o problema é que eu quero um teste de 1 amostra, não um teste de 2 amostras! Estou testando o nulo , e não E [ X 1 ] = E [ X 2 ] . Vou procurar o Kubinger et. al., paper (Ich kann schlecht Deutsche). E[X]=μE[X1]=E[X2]
shabbychef
Obrigado por esclarecer. Nesse caso, o jornal Kubinger não será muito útil para você. Sinto muito.
Henrik

Respostas:

5

Por que você está analisando testes não paramétricos? As suposições do teste t são violadas? Ou seja, dados ordinais ou não normais e variações inconstantes? Obviamente, se sua amostra for grande o suficiente, você poderá justificar o teste t paramétrico com maior poder, apesar da falta de normalidade na amostra. Da mesma forma, se sua preocupação é com variações desiguais, há correções no teste paramétrico que produzem valores p precisos (a correção de Welch).

Caso contrário, comparar seus resultados com o teste t não é uma boa maneira de fazer isso, porque os resultados do teste t são tendenciosos quando as suposições não são atendidas. O Mann-Whitney U é uma alternativa não-paramétrica apropriada, se é isso que você realmente precisa. Você só perde energia se estiver usando o teste não paramétrico quando puder justificadamente usar o teste t (porque as premissas são atendidas).

E, apenas para um pouco mais de fundo, vá aqui ...

http://www.jerrydallal.com/LHSP/STUDENT.HTM

Brett
fonte
os dados definitivamente não são normais. o excesso de curtose é da ordem de 10 a 20, a inclinação é da ordem de -0,2 a 0,2. Estou fazendo um teste t de 1 amostra, por isso não tenho certeza de segui-lo em relação a 'variações desiguais' ou ao teste U.
Shabbychef
Estou aceitando o conselho 'use um teste paramétrico'. isso não resolve exatamente minha pergunta, mas provavelmente era muito aberta.
21810 shabbychef
12

Concordo que, se você deseja realmente testar se as médias do grupo são diferentes (em vez de testar diferenças entre medianas do grupo ou médias aparadas, etc.), não deseja usar um teste não paramétrico que teste uma hipótese diferente.

  1. Em geral, os valores de p de um teste t tendem a ser razoavelmente precisos, dadas as partidas moderadas da suposição de normalidade dos resíduos. Confira este applet para obter uma intuição sobre essa robustez: http://onlinestatbook.com/stat_sim/robustness/index.html

  2. Se você ainda está preocupado com a violação da suposição de normalidade, pode querer iniciar . por exemplo, http://biostat.mc.vanderbilt.edu/wiki/pub/Main/JenniferThompson/ms_mtg_18oct07.pdf

  3. Você também pode transformar a variável dependente inclinada para resolver problemas com desvios da normalidade.

Jeromy Anglim
fonte
2
+1 resposta agradável e clara. Jeromy, posso fazer uma pergunta sobre o ponto 3? Eu entendo o raciocínio por trás da transformação dos dados, mas algo sempre me incomodou em fazer isso. Qual é a validade de relatar os resultados do teste t nos dados transformados para os dados não transformados (onde você não está "autorizado" a fazer um teste t)? Em outras palavras, se dois grupos são diferentes quando os dados são, por exemplo, transformados em log, em que bases você pode dizer que os dados brutos também são diferentes? Bare em mente, eu não sou um estatístico, então talvez eu só disse uma coisa absolutamente estúpida :)
nico
2
@nico Não tenho certeza de como reportar ou pensar sobre os resultados, mas se tudo o que você deseja mostrar é que, para alguns X e Y, mu_X! = mu_Y, deve ser verdade que, para todos os X_i <X_j, log ( X_i) <log (X_j) e para todos os X_i> X_j, log (X_i)> log (X_j). É por isso que, para testes não paramétricos que operam com classificações, as transformações dos dados não afetam o resultado. Eu acho que disso, você pode assumir que, se algum teste mostrar esse mu_log (X)! = Mu_log (Y), então mu_X! = Mu_Y.
precisa saber é o seguinte
obrigado pela resposta (s). de fato, o teste t parece manter a taxa nominal do tipo I sob entrada levemente distorcida / kurtótica. no entanto, eu esperava algo com mais poder. re: 2, eu implementei o Wilcox ' trimpbe trimcibt, mas eles são um pouco lentos para fazer meus testes de energia, pelo menos para o meu gosto. re: 3, eu tinha pensado nesse método, mas estou interessado na média dos dados não transformados (ou seja, não estou comparando 2 RVs com um teste t; nesse caso, uma transformação monotônica seria adequada para uma comparação baseada em classificação, como observado por @JoFrhwld).
shabbychef
2
@nico Se a distribuição populacional de resíduos for a mesma em dois grupos, imagino que sempre que houver uma diferença no grupo populacional bruto, também haverá diferenças nos meios grupais de uma transformação de preservação da ordem. Dito isso, os valores de p e os intervalos de confiança tenderão a mudar ligeiramente com base no uso de dados brutos ou dados transformados. Em geral, prefiro usar transformações quando elas parecem uma métrica significativa para entender a variável (por exemplo, escala Richter, decibéis, registros de contagens etc.).
precisa saber é o seguinte
3

t

O 'mais recente e o melhor' é devido a Ogaswara , com referências a Hall e outros.

shabbychef
fonte
0

Não tenho reputação suficiente para comentar, portanto, como resposta: dê uma olhada nessa cálculo. Eu acho que isso fornece uma excelente resposta. Em resumo:

O desempenho assintótico é muito mais sensível a desvios da normalidade na forma de assimetria do que na forma de curtose ... Assim, o teste t de Student é sensível à assimetria, mas relativamente robusto contra caudas pesadas, e é razoável usar um teste para normalidade direcionada para alternativas inclinadas antes de aplicar o teste t.

Christoph
fonte