Nem tenho certeza de que a pergunta faça muito sentido, mas acho que vi alguns títulos de trabalhos em que eles propunham floresta aleatória com efeitos aleatórios. Isso é possível em R?
r
random-forest
random-effects-model
mguzmann
fonte
fonte
Respostas:
Eles não são comumente usados juntos e deve-se tomar cuidado antes de combiná-los.
Florestas aleatórias são normalmente usadas como classificadores. O motivo pelo qual você usaria uma floresta aleatória em vez de outro método (por exemplo, agrupamento K-means) é que você pode ter um grande número de dimensões pelas quais deseja classificar. O problema de ter um grande número de dimensões é que, se você quisesse testar todas as combinações de ordens de dimensão, teria um grande número de opções (ela cresce mais rapidamente que o número de dimensões fatorial).
Efeitos aleatórios são normalmente usados em regressão com medidas repetidas da mesma coisa. Eles são comumente usados em modelos de efeitos mistos, nos quais o termo misto se refere a efeitos fixos e aleatórios. Pensa-se que os efeitos fixos representam os parâmetros que você verá novamente (por exemplo, um medicamento ou a idade de uma pessoa). Pensa-se que os efeitos aleatórios representam uma instância de variabilidade em torno de um parâmetro que você não verá novamente (por exemplo, uma pessoa específica).
Existem exemplos de como usá-los juntos quando houver dados em cluster http://dx.doi.org/10.1080/00949655.2012.741599 e http://www2.ims.nus.edu.sg/Programs/014swclass/files/denis.pdf .
Não conheço nenhum pacote R que possa fazer essa análise.
fonte
Sim, é possível. Você deve verificar " Árvores RE-EM: uma abordagem de mineração de dados para dados longitudinais e em cluster " e o pacote R associado REEMtree .
Já faz um tempo desde que eu olhei para o jornal. Lembro que os autores ainda não haviam tentado formar conjuntos dessas árvores, mas que nada sugeria que isso não daria certo.
fonte
Efeitos Aleatórios Florestas Aleatórias (MERFs) são uma coisa. Como a resposta acima afirma, há algumas ótimas pesquisas sobre eles pelo grupo do Dr. Larocque no HEC Montreal. O artigo está aqui: http://www.tandfonline.com/doi/abs/10.1080/00949655.2012.741599 .
Essencialmente, é uma maneira teoricamente sólida de combinar a modelagem não linear de florestas aleatórias com efeitos aleatórios lineares.
Acabamos de lançar um pacote de código aberto em Python implementando o MERF usando o algoritmo acima no documento.
Escrevemos um post detalhado sobre o pacote e como usá-lo para conjuntos de dados em cluster.
fonte