Prevendo vários alvos ou classes?

12

Suponha que eu esteja construindo um modelo preditivo no qual estou tentando prever vários eventos (por exemplo, o lançamento de um dado e o lançamento de uma moeda). A maioria dos algoritmos com os quais estou familiarizado trabalha apenas com um destino, por isso estou me perguntando se existe uma abordagem padrão para esse tipo de coisa.

Eu vejo duas opções possíveis. Talvez a abordagem mais ingênua seria simplesmente tratá-los como dois problemas diferentes e depois combinar os resultados. No entanto, isso tem sérias desvantagens quando os dois destinos não são independentes (e, em muitos casos, podem ser muito dependentes).

Uma abordagem mais sensata para mim seria criar um atributo de destino combinado. Assim, no caso de um dado e uma moeda, teríamos estados ( ( 1 , H ) , ( 1 , T ) , ( 2 , H ) , etc.). No entanto, isso pode levar o número de estados / classes no destino composto a aumentar bastante rapidamente (e se tivéssemos 2 dados, etc.). Além disso, isso parece estranho no caso em que um atributo é categórico enquanto o outro é numérico (por exemplo, se prever temperatura e tipo de precipitação).62=12(1,H),(1,T),(2,H)

Existe alguma abordagem padrão para esse tipo de coisa? Como alternativa, existem algoritmos de aprendizado projetados especificamente para lidar com isso?

Michael McGowan
fonte
Você quer dizer muito dependente no final do seu segundo parágrafo. Se sim, você já pensou em algum tipo de abordagem da Cadeia de Markov depois que a primeira variável for estimada?
Michelle
Opa, eu realmente quis dizer dependente e consertei, obrigado. Eu não havia considerado uma abordagem da Cadeia de Markov e vou ter que pensar se isso faz sentido aqui; obrigado.
Michael McGowan

Respostas:

5

Isso é conhecido na comunidade de Machine Learning como "Multi-Label Learning". Existem várias abordagens para o problema, incluindo as que você descreve na sua pergunta. Alguns recursos para você começar:

tdc
fonte
0

Onde você tem duas variáveis ​​com os mesmos preditores, e a variável B também tem a variável A como preditor, é possível que esteja procurando um problema de otimização, no qual deseja otimizar as estimativas de A e B simultaneamente. Não faz sentido otimizar uma, se você receber uma estimativa ruim para a segunda.

Isso seria um problema de pesquisa operacional e, infelizmente, fora do meu domínio de especialização.

Michelle
fonte