Regressão linear com uma variável dependente que é uma razão

10

Estou fazendo regressões lineares em que a variável dependente é uma razão que pode variar de 0,01 a 100.

Tudo bem fazer o log da variável dependente e a regressão nisso? Estou combinando os resultados de um estudo e foi isso que eles fizeram.

Qual é a diferença entre pegar o log e usar a proporção como está?

Aaron Kreider
fonte
Estou procurando uma avaliação dos preços das casas. Minha variável independente é Preço da habitação avaliado, dividido pelo preço de venda. Minhas variáveis ​​dependentes são várias categorias de raça (percentual de negros, brancos, hispânicos e asiáticos) e renda média da família. Estou descobrindo que os setores censitários com uma porcentagem maior de negros têm uma avaliação mais alta do que outras áreas.
Aaron Kreider
Por que você não usa regressão logística? Você pode definir a proporção, pois sua variável dependente é composta por muitos pacotes estatísticos.
statnoobie1
11
A regressão logística é tipicamente para valores binários ou proporções (entre 0 e 1). Não é aplicável aqui desde a proporção pode exceder 1.
Max Ghenis

Respostas:

9

log(ab)=log(a)log(b)


YZ=α0 0+αXX+ϵ

Y=Z1 1nα0 0+ZXαX+Z-1 1ϵ

Y=β0 0+βXX+Z1 1nα0 0+ZXαX+Z-1 1ϵ

aka ...

  • Regressar numerador por variáveis ​​independentes originais, denominador e denominador vezes as variáveis ​​originais
  • Regressão de peso por denominador (inverso)

β0 0βX

Ressalva - Eu não estou convencido de que eu tenho uma compreensão completa dos rácios quer .

Afim
fonte
Você está assumindo um Z fixo? Eu tenho 27.000 casos (aka propriedades) e Y (preço de avaliação) e Z (preço de venda) diferem para cada um.
Aaron Kreider
Z-1 1Y=α0 0+αXX+ϵ
Está bem. Analisei as abordagens sugeridas na sua pergunta vinculada e elas fazem sentido. Não sei o suficiente sobre isso para recomendá-los de uma maneira ou de outra, mas se alguém confirmar suas sugestões, eu poderia testá-las.
Aaron Kreider