Modelagem de preços de aluguel - qual método de interpolação usar?

13

Eu tenho um conjunto de dados nacional de ~ 1,4 milhão de famílias. Lá eu tenho informações sobre aluguel, tamanho (número de quartos e m2) e algumas características adicionais de cada família.

Eu gostaria de usar esses dados para criar uma superfície de preços de aluguel para todo o país e usar essas informações como proxy para a estimativa de valores de ~ 1,5 milhão de famílias restantes que pertencem ou não possuem informações de aluguel.

Algumas perguntas aqui:

Essa abordagem é apropriada para esse tipo de problema?

Qual método de interpolação seria mais adequado para uso aqui?

Além disso, seria possível levar informações sobre, por exemplo, o tamanho da família em consideração?

Estou no ArcGIS 9.3 com licença ArcInfo.

radek
fonte
1
Parece que os sistemas de avaliação de massa assistida por computador (CAMA) precisariam fazer algo semelhante. Eu me pergunto como eles lidam com isso. pt.wikipedia.org/wiki/Computer_Assisted_Mass_Appraisal
Kirk Kuykendall

Respostas:

10

A idéia é boa, mas a implementação proposta pode ser simplista demais para ser credível. Os aluguéis são propriedade dos sistemas econômicos. Além de serem influenciados pela localização, estão relacionados a outras variáveis ​​econômicas de maneiras importantes: estado da economia local (e nacional), preços da moradia local, disponibilidade de capital, taxas de emprego etc. Para fazer um bom trabalho, é necessário um modelo econométrico . Pode ser benéfico ter alguns termos de atraso espacial , mas antes que essas complicações sejam consideradas, é necessário incluir muitas dessas covariáveis ​​econômicas.

Dito isto, sua capacidade de obter sucesso depende das relações entre os dados que você possui e os aluguéis que deseja prever. Se seus dados são uma amostra representativa de todo o país e estão geograficamente dispersos - pense nas casas como passas em um cookie e você tem dados sobre todas as outras passas no cookie -, um modelo relativamente simples pode ser suficiente. Se seus dados estiverem geograficamente focados - talvez você tenha informações sobre passas no lado direito do cookie e deseje fazer previsões para as passas no lado esquerdo -, o problema é mais difícil.

Um bom ponto de partida seria ajustar um modelo econométrico linear convencional de aluguel às características domésticas e às características espaciais brutas (como políticas tributárias estaduais ou municipais), computar os resíduos e começar a explorar os resíduos espacialmente (usando variografia , suavização do núcleo espacial , etc) para capturar os efeitos geográficos.

Software adequado está disponível como add-ons para R .

whuber
fonte
@whubber O link para o documento que descreve a variografia parece estar morto. Existe uma chance de atualizá-lo?
Radek
1
Obrigado, @radek. É surpreendentemente difícil encontrar uma exposição de variografia na Web que seja introdutória e precisa e não seja apenas um manual de software. Eu encontrei uma tese de doutorado recente que - a julgar pelo seu resumo e introdução - parece ser clara e completa e parte de um ponto relativamente elementar.
whuber
7

Como uma introdução muito gentil aos tópicos sobre regressão espacial, eu recomendo verificar a pasta de trabalho GeoDa (os capítulos 22 a 25 serão de grande interesse). Mesmo se você não quiser usar o software, é uma visão geral muito abrangente da regressão espacial.

As funções de regressão incorporadas no ArcMap lidam com tantos dados (não que algum software tenha dificuldades com tantos pontos?)

Andy W
fonte
3
(+1) 1,4 milhão de pontos não é problema para regressão. (O esforço em algoritmos de mínimos quadrados, por exemplo, é tipicamente proporcional ao cubo do número de variáveis. A configuração das equações requer apenas uma varredura rápida no conjunto de dados.) O problema real é que 1,4 milhão de casos terão uma riqueza e estrutura detalhada: uma boa análise seria extremamente trabalhosa. (Esse conjunto de dados pode gerar um monte de teses de doutorado em economia, tenho certeza.) O truque, portanto, é fazer o trabalho necessário para obter respostas suficientemente precisas e defensáveis ​​para a tarefa em questão.
whuber
3

Eu já vi trabalhos semelhantes feitos para preços de casas usando modelagem hedônica. Veja http://scholar.google.com/scholar?hl=pt_BR&q=hedonic+price+geography para exemplos.

Ian Turton
fonte
2
(+1) Concordo que a literatura sobre modelos hedônicos de precificação de moradias é amplamente aplicável a essa questão. Eu me refiz a sugeri que, embora um indivíduo que não esteja familiarizado com a regressão possa achar assustador o trabalho de todos os econométricos (eu sei que às vezes eu faço!) Em teoria, seria uma boa literatura revisar, especialmente para covariáveis de interesse.
Andy W