Suponha que tenhamos dois tipos de recursos de entrada, categóricos e contínuos. Os dados categóricos podem ser representados como um código A quente, enquanto os dados contínuos são apenas um vetor B no espaço de dimensão N. Parece que o simples uso de concat (A, B) não é uma boa escolha, pois A, B são tipos de dados totalmente diferentes. Por exemplo, ao contrário de B, não há ordem numérica em A. Portanto, minha pergunta é como combinar esses dois tipos de dados ou existe algum método convencional para lidar com eles.
Na verdade, proponho uma estrutura ingênua, como apresentado na figura
Como você vê, as primeiras camadas são usadas para alterar (ou mapear) os dados A para alguma saída do meio no espaço contínuo e, em seguida, são concatenados com os dados B, que formam um novo recurso de entrada no espaço contínuo para as camadas posteriores. Gostaria de saber se é razoável ou se é apenas um jogo de "tentativa e erro". Obrigado.