Meu conhecimento (muito básico) do modelo de regressão Tobit não é de uma classe, como eu preferiria. Em vez disso, peguei informações aqui e ali através de várias pesquisas na Internet. Meu melhor palpite sobre as suposições para regressão truncada é que elas são muito semelhantes às suposições de mínimos quadrados ordinários (OLS). Não tenho idéia se isso está correto, no entanto.
Daí minha pergunta: quais são as premissas que devo verificar ao realizar a regressão Tobit?
Nota: A forma original desta pergunta se referia à regressão truncada, que não era o modelo que eu estava usando ou perguntando. Eu corrigi a pergunta.
regression
assumptions
Firefeather
fonte
fonte
Respostas:
Se buscarmos uma resposta simples, o trecho do livro de Wooldridge (página 533) é muito apropriado:
As anotações neste trecho vêm do modelo Tobit:
Resumir a diferença entre os mínimos quadrados e a regressão de Tobit é a suposição inerente de normalidade neste último.
Também sempre achei que o artigo original da Amemyia era bastante bom ao expor os fundamentos teóricos da regressão Tobit.
fonte
Para repetir o comentário de Aniko: A principal suposição é a existência de truncamento. Esta não é a mesma suposição que as duas outras possibilidades que seu post me sugere: limites e seleção de amostras.
Se você tiver uma variável dependente fundamentalmente limitada em vez de uma truncada, poderá mudar para uma estrutura de modelo linear generalizada com uma das distribuições (menos frequentemente escolhidas) para Y, por exemplo, log-normal, gama, exponencial etc., que respeitam isso limite inferior.
Como alternativa, você pode se perguntar se acha que o processo que gera as zero observações em seu modelo é o mesmo que gera valores estritamente positivos - os preços em sua aplicação, eu acho. Se esse não for o caso, algo da classe de modelos de seleção de amostras (por exemplo, modelos de Heckman) pode ser apropriado. Nesse caso, você poderia especificar um modelo de disposição para pagar qualquer preço e outro modelo de qual preço seus sujeitos pagariam se quisessem pagar algo.
Em resumo, você provavelmente deseja revisar a diferença entre assumir variáveis dependentes selecionadas truncadas, censuradas, limitadas e de amostra. Qual você deseja virá dos detalhes do seu aplicativo. Uma vez feita a primeira suposição mais importante, é possível determinar com mais facilidade se você gosta das suposições específicas de qualquer modelo na classe escolhida. Alguns dos modelos de seleção de amostra têm suposições bastante difíceis de verificar ...
fonte
@Firefeather: Seus dados contêm (e podem realmente apenas conter) apenas valores positivos? Nesse caso, modele-o usando um modelo linear generalizado com erro gama e link de log. Se ele contiver zeros, você poderá considerar um estágio de dois (regressão logística para probabilidade de zero e regressão gama para os valores positivos). Este último cenário também pode ser modelado como uma única regressão usando uma gama inflada zero. Algumas grandes explicações disso foram dadas em uma lista do SAS há alguns anos atrás. Comece aqui, se estiver interessado, e procure acompanhamento. Texto do link
Pode ajudar a apontar para outra direção se a regressão truncada for implausível.
fonte
Como outros mencionaram aqui, a principal aplicação da regressão de tobit é onde há censura de dados. Tobit é amplamente utilizado em conjunto com a Data Envelopment Analysis (DEA) e pelo economista. No DEA, a pontuação de eficiência fica entre 0 e 1, o que significa que a variável dependente é censurada em 0 da esquerda e 1 da direita. Portanto, a aplicação de regressão linear (OLS) não é viável.
Tobit é uma combinação de probit e regressão truncada. Deve-se tomar cuidado ao diferenciar censura e truncamento:
Tobit = Probit + Regressão de truncamento
O modelo Tobit assume normalidade como o modelo probit.
Passos:
O modelo de probit decide se a variável dependente é 0 ou 1. Se a variável dependente for 1, então em quanto (assumindo a censura em 0) .
O coeficiente é o mesmo para o modelo de decisão. é o termo de correção para ajustar os valores censurados (zeros).β σλ(x′βσ)
Verifique também o modelo de Cragg, onde você pode usar diferentes em cada etapa.β
fonte