Quais são as premissas para a aplicação de um modelo de regressão Tobit?

9

Meu conhecimento (muito básico) do modelo de regressão Tobit não é de uma classe, como eu preferiria. Em vez disso, peguei informações aqui e ali através de várias pesquisas na Internet. Meu melhor palpite sobre as suposições para regressão truncada é que elas são muito semelhantes às suposições de mínimos quadrados ordinários (OLS). Não tenho idéia se isso está correto, no entanto.

Daí minha pergunta: quais são as premissas que devo verificar ao realizar a regressão Tobit?

Nota: A forma original desta pergunta se referia à regressão truncada, que não era o modelo que eu estava usando ou perguntando. Eu corrigi a pergunta.

Firefeather
fonte
11
Você não deve usar regressão truncada apenas porque possui dados inclinados ou limitados. É especificamente para situações em que valores abaixo de um limite (por exemplo, valores negativos) são possíveis, mas não seriam observados por algum motivo. Essa é a situação que você tem?
Aniko
P(Y=0)>0Y
Grande erro; Eu percebi que eu quis dizer regressão Tobit o tempo todo, não regressão truncada . Acabei de alterar a pergunta para refletir esse erro.
precisa saber é o seguinte
A referência Wooldridge ainda é a referência correta; isto é, refere-se à regressão Tobit.
precisa saber é o seguinte
Aniko está certa, esse tobit pode não ser a melhor escolha. Dê uma olhada no seguinte para descobrir alternativas: ideas.repec.org/p/boc/bost10/2.html

Respostas:

6

Se buscarmos uma resposta simples, o trecho do livro de Wooldridge (página 533) é muito apropriado:

β^βyxy|xNormal(xβ,σ2)y=yβE(u|x)=0E(xu)=0

As anotações neste trecho vêm do modelo Tobit:

y=xβ+u,u|xN(0,σ2)y=max(y,0)
yx

Resumir a diferença entre os mínimos quadrados e a regressão de Tobit é a suposição inerente de normalidade neste último.

Também sempre achei que o artigo original da Amemyia era bastante bom ao expor os fundamentos teóricos da regressão Tobit.

mpiktas
fonte
Uau! Obrigado por encontrar uma referência visível - não pensei em procurar no Google Livros ao procurar uma cópia do livro de Wooldridge.
Firefeather
4

Para repetir o comentário de Aniko: A principal suposição é a existência de truncamento. Esta não é a mesma suposição que as duas outras possibilidades que seu post me sugere: limites e seleção de amostras.

Se você tiver uma variável dependente fundamentalmente limitada em vez de uma truncada, poderá mudar para uma estrutura de modelo linear generalizada com uma das distribuições (menos frequentemente escolhidas) para Y, por exemplo, log-normal, gama, exponencial etc., que respeitam isso limite inferior.

Como alternativa, você pode se perguntar se acha que o processo que gera as zero observações em seu modelo é o mesmo que gera valores estritamente positivos - os preços em sua aplicação, eu acho. Se esse não for o caso, algo da classe de modelos de seleção de amostras (por exemplo, modelos de Heckman) pode ser apropriado. Nesse caso, você poderia especificar um modelo de disposição para pagar qualquer preço e outro modelo de qual preço seus sujeitos pagariam se quisessem pagar algo.

Em resumo, você provavelmente deseja revisar a diferença entre assumir variáveis ​​dependentes selecionadas truncadas, censuradas, limitadas e de amostra. Qual você deseja virá dos detalhes do seu aplicativo. Uma vez feita a primeira suposição mais importante, é possível determinar com mais facilidade se você gosta das suposições específicas de qualquer modelo na classe escolhida. Alguns dos modelos de seleção de amostra têm suposições bastante difíceis de verificar ...

conjugateprior
fonte
3

@Firefeather: Seus dados contêm (e podem realmente apenas conter) apenas valores positivos? Nesse caso, modele-o usando um modelo linear generalizado com erro gama e link de log. Se ele contiver zeros, você poderá considerar um estágio de dois (regressão logística para probabilidade de zero e regressão gama para os valores positivos). Este último cenário também pode ser modelado como uma única regressão usando uma gama inflada zero. Algumas grandes explicações disso foram dadas em uma lista do SAS há alguns anos atrás. Comece aqui, se estiver interessado, e procure acompanhamento. Texto do link

Pode ajudar a apontar para outra direção se a regressão truncada for implausível.

B_Miner
fonte
2

Como outros mencionaram aqui, a principal aplicação da regressão de tobit é onde há censura de dados. Tobit é amplamente utilizado em conjunto com a Data Envelopment Analysis (DEA) e pelo economista. No DEA, a pontuação de eficiência fica entre 0 e 1, o que significa que a variável dependente é censurada em 0 da esquerda e 1 da direita. Portanto, a aplicação de regressão linear (OLS) não é viável.

Tobit é uma combinação de probit e regressão truncada. Deve-se tomar cuidado ao diferenciar censura e truncamento:

  • Censura: quando as observações de limite estão na amostra. Os valores das variáveis ​​dependentes atingem um limite à esquerda ou à direita.
  • Truncamento: observação em que determinado intervalo de valores dependentes não está incluído no estudo. Por exemplo, apenas valores positivos. O truncamento tem maior perda de informações do que censura.

Tobit = Probit + Regressão de truncamento

O modelo Tobit assume normalidade como o modelo probit.

Passos:

  1. O modelo de probit decide se a variável dependente é 0 ou 1. Se a variável dependente for 1, então em quanto (assumindo a censura em 0) .

    (Discreet decision)P(y>0)=Φ(xβ)
  2. (Continuous decision)E(yy>0)=xβ+σλ(xβσ)

O coeficiente é o mesmo para o modelo de decisão. é o termo de correção para ajustar os valores censurados (zeros). βσλ(xβσ)

Verifique também o modelo de Cragg, onde você pode usar diferentes em cada etapa.β

Amar nayak
fonte
Bem-vindo ao site, @Amarnayak. Eu editei sua postagem para usar a formatação type. Verifique se ele ainda diz o que você deseja. LATEX
gung - Restabelece Monica