Eu tenho duas perguntas relacionadas ao conceito de "consistência da aprendizagem" para aqueles que estão familiarizados com a teoria estatística da aprendizagem à la Vapnik.
Questão 1.
O processo de aprendizado é chamado de consistente (para a classe de funções e distribuição de probabilidade ) E se
Essas duas condições são independentes. Na p. 83 da "Teoria Estatística da Aprendizagem" de Vapnik, há um exemplo de um conjunto de classificadoresde modo que a segunda convergência ocorra, mas a primeira não. Eu estava pensando em um exemplo de um conjunto de classificadores, de modo que a primeira convergência ocorre, mas a segunda não, e não consegui encontrar nada. Alguém pode me ajudar aqui?
Questão 2.
O processo de aprendizado é chamado de consistência não trivial (ou consistentemente consistente) (para a classe de funções e distribuição de probabilidade ) se para qualquer número real tal que definir não está vazio, temos:
O P. 81 da "Teoria Estatística da Aprendizagem" de Vapnik fornece uma ilustração de por que queremos considerar consistência estrita em vez da consistência definida na Questão 1, ou seja, por que queremos introduzir e considere para qualquer . Todos os outros textos que consideram consistência estrita essencialmente duplicam a ilustração de Vapnik quando querem explicar a lógica por trás do conceito de consistência estrita. No entanto, não estou muito satisfeito com a ilustração de Vapnik por dois motivos: primeiro, é feito em termos de funções de perdae não os classificadores; e, segundo, Fig. 3.2. do livro realmente não faz sentido quando consideramos a função de perda comum para problemas de classificação, ou seja, a função que é igual a 0 quando o rótulo de classe previsto é igual ao rótulo de classe real e a 1 caso contrário.
Então, é possível dar outra ilustração, mais sensata, da lógica por trás do conceito de consistência estrita? Essencialmente, precisamos de um exemplo de um conjunto de classificadores para que esses classificadores não sejam consistentes (em termos da definição da Questão 1) e de um novo classificador que tenha um desempenho melhor do que qualquer um dos classificadores do conjunto, para que, quando adicionarmos esses classificadores para o conjunto, acabamos com o caso de "consistência trivial". Alguma ideia?