Eu tenho a saída de precisão do classificador em porcentagem e o número de amostras de entrada. Existe algum teste que possa dizer quão estatisticamente significativo é o resultado com base nessas informações.
obrigado
Eu tenho a saída de precisão do classificador em porcentagem e o número de amostras de entrada. Existe algum teste que possa dizer quão estatisticamente significativo é o resultado com base nessas informações.
obrigado
Respostas:
Você deseja definir a distribuição da precisão de apenas adivinhar. Talvez seja comoX/ n onde binômio X∼ ( n , p ) para alguns p conhecidos p (digamos 50%).
Em seguida, calcule a chance de observar os resultados que você fez, se esse modelo nulo for verdadeiro. Em R, você pode usar
binom.test
ou calcular diretamente compbinom
.Geralmente, você deseja comparar a precisão não com "adivinhação", mas com algum método alternativo; nesse caso, você pode usar o teste de McNemar ; em R
mcnemar.test
,.fonte
Não vejo onde é útil testar contra a aleatoriedade completa. Um classificador que só pode superar suposições aleatórias puras não é muito útil. Um problema maior é o uso da proporção classificada corretamente como sua pontuação de precisão. Esta é uma regra de pontuação imprópria descontínua que pode ser facilmente manipulada porque é arbitrária e insensível. Uma (de muitas) maneiras de ver suas deficiências é calcular a proporção classificada corretamente se você tiver um modelo com apenas uma interceptação. Será alto se os resultados não chegarem perto de 0,5 na prevalência.
Depois de escolher uma regra mais adequada, seria valioso calcular um intervalo de confiança para o índice. A significância estatística é de pouco valor.
fonte
Com certeza você pode computar um intervalo de confiança . Se é sua precisão estimada em um conjunto de testes de elementos, isso significa que Assim, Então você pode dizer que: Por exemplo, você pode calcular o intervalo de Wilson .acc N
Eu acho que você pode calcular quanto seu desempenho difere de um aleatório calculando o ganho . A precisão de um classificador aleatório é: que é a frequência empírica da classe estimada no conjunto de testes e é o número de diferentes classes. Em média, um classificador aleatória, que classifica aleatório adivinhar a classe baseando-se na probabilidade de antecedentes do conjunto de teste, classifica exemplos de classe correctamente. Onde é o número de registros da classe
O ganho é:
Na verdade, acho que um teste estatístico pode ser esboçado. O numerador pode ser visto como uma variável aleatória Normal, , mas você deve descobrir que tipo de variável aleatória o denominador poderia ser.N( acc , p ( 1 - p ) / N) accr
fonte
Você pode estar interessado nos seguintes documentos:
Eu acho que eles cobrem o que Dimitrios Athanasakis fala.
Eu implementei uma opção de Yeh da maneira que eu a entendo:
http://www.clips.uantwerpen.be/~vincent/software#art
fonte
Eu acho que uma coisa que você poderia experimentar seria um teste de permutação. Simplesmente, permita apenas aleatoriamente permutar os pares de saída desejados que você alimenta para o seu classificador várias vezes. Se ele não conseguir reproduzir nada no mesmo nível acima de 100 permutações diferentes, é significativo no intervalo de 99% e assim por diante. Este é basicamente o mesmo processo usado para obter valores de p (que correspondem à probabilidade de obter uma correlação linear da mesma mangnitude após permutar aleatoriamente os dados) e assim por diante.
fonte