Métodos de conjuntos baseados em árvores, como Floresta Aleatória e derivadas subsequentes (por exemplo, floresta condicional), todos pretendem ser úteis nos chamados problemas "pequenos n , grandes p ", para identificar importância relativa variável. De fato, esse parece ser o caso, mas minha pergunta é até que ponto essa capacidade pode ser levada? Pode-se ter, digamos, 30 observações e 100 variáveis? Qual é o ponto de ruptura dessa abordagem e existem regras práticas decentes? Eu preferiria e aceitaria respostas apoiadas por links para evidências reais (não conjecturas), usando conjuntos de dados simulados ou reais. Eu não encontrei muito sobre este último ( aqui e aqui), portanto suas sugestões de referência de pensamentos / conselhos / (no tópico) são bem-vindas!
fonte