Digamos que tenho um problema de seleção de modelos e estou tentando usar o AIC ou o BIC para avaliar os modelos. Isso é direto para modelos que possuem algum número de parâmetros com valor real.
No entanto, e se um de nossos modelos (por exemplo, o modelo de Mallows ) tiver uma permutação, além de alguns parâmetros com valor real em vez de apenas parâmetros com valor real? Ainda posso maximizar a probabilidade sobre os parâmetros do modelo, por exemplo, obter uma permutação e um parâmetro . No entanto, quantos parâmetros contam para a computação da AIC / BIC?
Respostas:
Intuitivamente, suspeito que o conjunto de todas as permutações nos elementos seja equivalente aos parâmetros .p 2 - 2 p + 1p p2−2p+1
Isso ocorre porque as matrizes de permutação são os pontos extremos do espaço convexo das matrizes reais duplamente estocásticas da classificação e, em geral, as matrizes duplamente estocásticas têm parâmetros (você obtém restrições porque todas as linhas somam tem que ser 1 e as somas da coluna devem ser 1, mas uma delas é redundante, portanto, você tem restrições nas entradas ).p 2 - 2 p + 1 2 p 2 p - 1 p 2p p2−2p+1 2p 2p−1 p2
Não tenho provas, mas parece certo. Talvez valha a pena tentar numericamente?
fonte