Dados pontos de dados, cada um com recursos, são rotulados como , o outro é rotulado como . Cada recurso recebe um valor de aleatoriamente (distribuição uniforme). Qual é a probabilidade de existir um hiperplano que possa dividir as duas classes?
Vamos considerar o caso mais fácil primeiro, ou seja, .
Respostas:
Supondo que não haja duplicatas nos dados.
Sen ≤ d+ 1 , a probabilidade é Pr = 1 .
Para outras combinações de( n , d) , consulte o seguinte gráfico:
Gerei esse gráfico simulando dados de entrada e saída conforme especificado no OP. Separabilidade linear foi definida como falha de convergência em um modelo de regressão logística, devido ao efeito Hauck-Donner .
Código para o enredo (em Julia):
fonte