Florestas aleatórias para regressão multivariada

23

Eu tenho um problema de regressão de várias saídas com entrada e saídas . As saídas têm uma estrutura de correlação não linear complexa.dxdy

Eu gostaria de usar florestas aleatórias para fazer a regressão. Até onde eu sei, as florestas aleatórias para regressão funcionam apenas com uma única saída, então eu teria que treinar florestas aleatórias - uma para cada saída. Isso ignora suas correlações.dy

Existe uma extensão para florestas aleatórias que leva em consideração as correlações de saída? Talvez algo como regressão de processo gaussiana para aprendizado de múltiplas tarefas .

sergeyf
fonte
4
aqui está o que eu tenho sido capaz de escavar até agora: scikit-learn.org/dev/modules/tree.html#multi-output-problems
sergeyf
1
certo. tenho "imagens" de alta dimensão (na verdade espectros dI / dV) de peptídeos. o objetivo é descobrir os locais e classes dos aminoácidos que compõem o peptídeo. minha primeira abordagem foi a segmentação de imagens, mas os CRFs e as florestas aleatórias em pixels falharam. agora, em vez de dizer que cada pixel "pertence" a um e apenas um aminoácido (na verdade não é verdade), estou atribuindo a cada pixel um valor relativo de "influência" dos aminoácidos próximos. isso resulta em um histograma dimensional para cada pixel. portanto, regressão de saída múltipla! dy
sergeyf
1
Pode ser uma resposta tardia: em Crimisini et al. Florestas de Decisão: Uma Estrutura Unificada para Classificação, Regressão, Estimativa de Densidade, Aprendizagem múltipla Eles usam RF de uma maneira que possa ser adequada para a identificação de limites de órgãos.
Simone
4
Isso pode ser tarde também, mas pode ajudar quem se deparar com este post. A Floresta aleatória pode ser facilmente treinada usando dados multivariados. Tudo acontece da mesma maneira, no entanto, em vez de usar a variação para o cálculo do ganho de informação, usamos a covariância das múltiplas variáveis ​​de saída. E, mais importante, as folhas agora contêm PDFs em dimensões N.
masad
1
Não sei que o RF "Isso ignora suas correlações". Dada a natureza do conjunto do RF, acho que eles podem explicar as correlações. Se eles recebessem informações univariadas e produzissem informações univariadas, não estariam respondendo por correlações.
EngrStudent - Restabelece Monica

Respostas: