Eu tenho um conjunto de dados nacional de ~ 1,4 milhão de famílias. Lá eu tenho informações sobre aluguel, tamanho (número de quartos e m2) e algumas características adicionais de cada família.
Eu gostaria de usar esses dados para criar uma superfície de preços de aluguel para todo o país e usar essas informações como proxy para a estimativa de valores de ~ 1,5 milhão de famílias restantes que pertencem ou não possuem informações de aluguel.
Algumas perguntas aqui:
Essa abordagem é apropriada para esse tipo de problema?
Qual método de interpolação seria mais adequado para uso aqui?
Além disso, seria possível levar informações sobre, por exemplo, o tamanho da família em consideração?
Estou no ArcGIS 9.3 com licença ArcInfo.
Respostas:
A idéia é boa, mas a implementação proposta pode ser simplista demais para ser credível. Os aluguéis são propriedade dos sistemas econômicos. Além de serem influenciados pela localização, estão relacionados a outras variáveis econômicas de maneiras importantes: estado da economia local (e nacional), preços da moradia local, disponibilidade de capital, taxas de emprego etc. Para fazer um bom trabalho, é necessário um modelo econométrico . Pode ser benéfico ter alguns termos de atraso espacial , mas antes que essas complicações sejam consideradas, é necessário incluir muitas dessas covariáveis econômicas.
Dito isto, sua capacidade de obter sucesso depende das relações entre os dados que você possui e os aluguéis que deseja prever. Se seus dados são uma amostra representativa de todo o país e estão geograficamente dispersos - pense nas casas como passas em um cookie e você tem dados sobre todas as outras passas no cookie -, um modelo relativamente simples pode ser suficiente. Se seus dados estiverem geograficamente focados - talvez você tenha informações sobre passas no lado direito do cookie e deseje fazer previsões para as passas no lado esquerdo -, o problema é mais difícil.
Um bom ponto de partida seria ajustar um modelo econométrico linear convencional de aluguel às características domésticas e às características espaciais brutas (como políticas tributárias estaduais ou municipais), computar os resíduos e começar a explorar os resíduos espacialmente (usando variografia , suavização do núcleo espacial , etc) para capturar os efeitos geográficos.
Software adequado está disponível como add-ons para R .
fonte
Como uma introdução muito gentil aos tópicos sobre regressão espacial, eu recomendo verificar a pasta de trabalho GeoDa (os capítulos 22 a 25 serão de grande interesse). Mesmo se você não quiser usar o software, é uma visão geral muito abrangente da regressão espacial.
As funções de regressão incorporadas no ArcMap lidam com tantos dados (não que algum software tenha dificuldades com tantos pontos?)
fonte
Eu já vi trabalhos semelhantes feitos para preços de casas usando modelagem hedônica. Veja http://scholar.google.com/scholar?hl=pt_BR&q=hedonic+price+geography para exemplos.
fonte