Temos 100 participantes em dois grupos, em cada grupo. Utilizamos uma avaliação da capacidade do funcionamento básico em quatro momentos. A avaliação compreende 6 perguntas, cada uma com pontuação de 0 a 5. Não temos pontuações individuais para cada pergunta, apenas pontuações totais que variam de 0 a 30. Pontuações mais altas indicam melhor funcionamento. O problema é que a avaliação é muito básica e tem um efeito teto significativo. Os resultados são muito negativos. A maioria dos participantes pontuou perto de 30, especialmente nos três momentos seguintes. É provável que nem todos os participantes que pontuaram nos limites superiores sejam realmente iguais em capacidade: alguns deles marcaram 30 e outros marcaram 30 com facilidade e pontuariam muito mais se possível e, portanto, os dados são censurado de cima.
Quero comparar os dois grupos e ao longo do tempo, mas obviamente isso é muito difícil, dada a natureza dos resultados. Transformações de qualquer tipo não fazem diferença. Fui informado de que o modelo Tobit é o melhor equipado para essa avaliação e posso executar a análise em R usando exemplos do artigo de Arne Henningen, Estimando modelos de regressão censurada em R usando o pacote censReg .
No entanto, tenho apenas um conhecimento básico de estatística e achei as informações sobre o modelo Tobit bastante complicadas. Eu preciso ser capaz de explicar esse modelo em linguagem simples e não consigo encontrar uma explicação em linguagem simples, explicações sobre o que o modelo Tobit realmente faz e como. Alguém pode explicar o modelo Tobit ou me apontar na direção de uma referência legível sem explicações estatísticas e matemáticas complicadas?
Extremamente grato por qualquer ajuda
fonte
Há um artigo de Berk na edição de 1983 da American Sociological Review (terceira edição) - foi assim que aprendi sobre censura. A explicação é especificamente sobre o viés de seleção, mas é absolutamente relevante para o seu problema. O viés de seleção, como Berk discute, é apenas censurar através do processo de seleção de amostras; no seu caso, a censura é resultado de um instrumento insensível. Existem alguns gráficos interessantes que mostram exatamente como você pode esperar que sua linha de regressão seja enviesada quando Y é censurado de maneiras diferentes. Em geral, o artigo é lógico e intuitivo, e não matemático (sim, eu os trato como separados, preferindo o primeiro). Tobit é discutido como uma solução para o problema.
De maneira mais geral, parece que o tobit é a ferramenta certa para o trabalho em questão. Basicamente, o modo como funciona é estimar a probabilidade de ser censurado e incorporá-lo à equação que prevê a pontuação. Há outra abordagem proposta por Heckman usando probit e a razão inversa dos moinhos, que é basicamente a mesma coisa, mas permite que você tenha variáveis diferentes que prevejam a probabilidade de censura e a pontuação no teste - obviamente isso não seria apropriado para a situação que você ter.
Uma outra recomendação - você pode considerar um modelo de token hierárquico em que as observações são aninhadas nos indivíduos. Isso explicaria corretamente a tendência de os erros serem associados nos indivíduos. Ou, se você não usar um modelo hierárquico, pelo menos, certifique-se de ajustar seus erros padrão para agrupar as observações em indivíduos. Sei que tudo isso pode ser feito no Stata e estou confiante de que o R com toda a sua versatilidade também pode fazê-lo .. mas, como um usuário ávido do Stata, não posso fornecer nenhuma orientação sobre como fazê-lo na R.
fonte