Algoritmos de aprendizado de máquina para classificação da cobertura do solo

37

Estou interessado em aprender qual software existe para classificação de terras usando algoritmos de aprendizado de máquina (por exemplo, k-NN, Floresta aleatória, árvores de decisão etc.) Estou ciente do pacote randomForest em R e MILK e SPy em Python.

Quais algoritmos de aprendizado de máquina de código aberto ou comerciais existem e são adequados para a classificação da cobertura do solo?

Aaron
fonte

Respostas:

34

Eu diria que o ambiente de software mais completo para Machine Learning e modelagem não paramétrica é R. regressão paramétrica spline, imputação, etc ... Eu recomendo a leitura: Hastie, T., R. Tibshirani, J. Friedman (2009) Os elementos da aprendizagem estatística: mineração de dados, inferência e previsão. Série Springer em Estatística.

Além do R, o software comercial da Salford Systems possui Random Forests, Multivariate Adaptive Regression Splines, CART e Gradient Boosting (TreeNet) disponíveis em um ambiente GUI. O RuleQuest ainda está vendendo o See5 / C5, que é uma versão atualizada do algoritmo C4 / ID3 CART. O Weka 3 da Universidade de Waikato é um esforço Java de GUI / Linha de Comando de código aberto com um grande número de modelos disponíveis.

Jeffrey Evans
fonte
11
@Aaron FYI, Falk Hutterman e eu estamos dando um workshop na reunião US-IALE (Landscape Ecology) 2013 em Austin, TX. Nosso foco será o uso de R para aprendizado de máquina e modelagem não paramétrica. Também fornecerei uma introdução ao uso de objetos espaciais em R para preparação de dados e especificação de modelos.
Jeffrey Evans
23

Eu recomendo fortemente o scikits-learn para Python. Ele suporta classificação supervisionada e não supervisionada e a documentação é excelente (consulte o tutorial do Machine Learning para análise de dados astronômicos e o vídeo do YouTube que acompanha) (nota: são 3 horas de duração).

O projeto está em desenvolvimento ativo, com a última versão sendo 0.12, lançada em setembro.

Quanto ao que o pacote é capaz, consulte Vizinhos Mais Próximos , Floresta Aleatória (em Métodos Ensembe) e Árvores de Decisão para usar os exemplos que você deu.

Infelizmente, não há GUI, a menos que você queira dedicar tempo à criação de uma, mas eu recomendo o iPython IDE como um excelente ambiente de script interativo, incluindo gráficos em linha com matplotlib no console QT.

om_henners
fonte
11

Uma boa visão geral das técnicas de aprendizado de máquina no R é a visão da tarefa de aprendizado de máquina . Ele oferece uma série de algoritmos diferentes, recomendados pelos especialistas.

Paul Hiemstra
fonte
6

Sua pergunta pressupõe que os algoritmos de aprendizado de máquina para classificação de terras são de alguma forma distintos do software usado para outros aplicativos de aprendizado de máquina. Existem algumas aplicações que requerem tratamento especial devido a características incomuns, mas não há nenhuma razão que eu saiba que o uso da terra precise de tratamento especial. Se os dados do uso da terra puderem ser colocados em um formato padrão delimitado por vírgula, as ferramentas existentes, como o R, deverão se sair bem. Agora, pode ou não haver software de uso da terra que usa modelos descobertos a partir de técnicas de aprendizado de máquina, mas essa é uma pergunta diferente.

Editado após a primeira resposta. -> A maioria dos principais pacotes de aprendizado de máquina possui algumas ferramentas para visualização espacial, embora elas possam não atender às suas necessidades particulares. Por exemplo, você conhece a biblioteca sp para R, destinada à visualização de dados espaciais? Vamos ver se consigo encontrar um link apropriado que dê o sabor do que você pode fazer com ele.

http://rwiki.sciviews.org/doku.php?id=tips:spatial-data:spatial_data_visualization Para obter uma lista mais extensa de ferramentas úteis para análise espacial em R, consulte http: //cran.r- project.org/web/views/Spatial.html, pois inclui ferramentas para geoestatística, análise ecológica e similares.

Clifton Davis
fonte
5

Você deu uma olhada no eCognition? Com sua nova versão (8.9), eles fornecem o algoritmo Random Forests dentro de um ambiente de GUI. Você pode criar boas árvores de processos e incluir recursos de objetos. insira a descrição da imagem aqui

Nicolas
fonte
4

Existe um grupo na Universidade Duke que desenvolveu algumas ferramentas de script interessantes para o ArcGIS, incluindo modelos florestais aleatórios.

Ferramentas de ecologia geoespacial marinha

insira a descrição da imagem aqui

Aaron
fonte
2
A caixa de ferramentas MGET é apenas um invólucro para R. Se você tem capacidade para usar R, pode evitar uma dor de cabeça considerável ao chamar R através do ArcGIS, através do Python (Rpy2). Você também não tem flexibilidade no uso de outras ferramentas em R que podem ser aplicadas aos objetos de RF, GAM, regressão ou modelo (s) CART resultantes.
precisa