Ao revisar um artigo, os autores declaram: "As variáveis de resultados contínuos que exibem uma distribuição distorcida foram transformadas, usando os logaritmos naturais, antes de os testes t serem conduzidos para satisfazer as premissas de pré-requisito da normalidade".
Essa é uma maneira aceitável de analisar dados não normais, principalmente se a distribuição subjacente não for necessariamente lognormal?
Essa pode ser uma pergunta muito estúpida, mas eu nunca vi isso antes ...
Respostas:
É comum tentar aplicar algum tipo de transformação à normalidade (usando, por exemplo, logaritmos, raízes quadradas, ...) quando encontrado com dados que não são normais. Embora o logaritmo produza bons resultados para dados inclinados razoavelmente, não há garantia de que funcione nesse caso específico. Também devemos ter em mente os comentários do @whubers ao analisar os dados transformados: "Um teste t para os logaritmos não é o mesmo que um teste t para dados não transformados nem um teste não paramétrico. O teste t nos logs compara dados geométricos significa, não os meios aritméticos (usuais) ".
As transformações em normalidade devem sempre ser seguidas de uma investigação da suposição de normalidade, para avaliar se os dados transformados parecem "suficientemente normais". Isso pode ser feito usando, por exemplo, histogramas, gráficos QQ e testes de normalidade. O teste t é particularmente sensível a desvios da normalidade na forma de assimetria e, portanto, seria preferível um teste de normalidade direcionado para alternativas de inclinação. Inclinação da amostra de Pearson é uma estatística de teste adequada neste caso.n- 1∑ni = 1( xEu- x¯)3( n- 1∑ni = 1( xEu- x¯)2)3 / 2
Em vez de escolher uma transformação (como logaritmos) porque ela funciona na maioria das vezes, prefiro usar o procedimento Box-Cox para escolher uma transformação usando os dados fornecidos. No entanto, existem alguns problemas filosóficos com isso; em particular se isso deve afetar o número de graus de liberdade no teste t, já que usamos algumas informações da amostra ao escolher qual transformação usar.
Finalmente, uma boa alternativa para usar o teste t após uma transformação ou um teste não paramétrico clássico é usar o análogo de autoinicialização do teste t. Não requer a suposição de normalidade e é um teste sobre os meios não transformados (e não sobre qualquer outra coisa).
fonte
De um modo geral, se as premissas necessárias para realizar um teste t não forem atendidas, seria mais apropriado usar um teste não paramétrico.
fonte