Recentemente, tomei consciência de que métodos "sem probabilidade" são analisados na literatura. No entanto, não sei ao certo o que significa um método de inferência ou otimização sem probabilidade .
No aprendizado de máquina, o objetivo geralmente é maximizar a probabilidade de alguns parâmetros se ajustarem a uma função, por exemplo, os pesos em uma rede neural.
Então, qual é exatamente a filosofia de uma abordagem sem probabilidade e por que redes adversárias, como as GANs, se enquadram nessa categoria?
Especificamente, [os recentes] métodos sem probabilidade são uma reformulação dos algoritmos ABC, em que ABC significa computação bayesiana aproximada . Isso pretende abranger métodos de inferência que não requerem o uso de uma função de probabilidade de forma fechada, mas ainda pretendem estudar um modelo estatístico específico. Eles estão livres da dificuldade computacional associada à probabilidade, mas não do modelo que produz essa probabilidade. Veja por exemplo
fonte
Para aumentar a litania de respostas, as estatísticas assintóticas são de fato livres de probabilidades.
Uma "probabilidade" aqui refere-se ao modelo de probabilidade para os dados . Eu posso não me importar com isso. Mas posso encontrar um estimador simples, como a média, que é um resumo adequado dos dados e quero fazer inferência sobre a média da distribuição (supondo que ela exista, o que geralmente é uma suposição razoável).
Pelo teorema do limite central, a média tem uma distribuição normal aproximada em N grande quando a variância também existe. Posso criar testes consistentes (o poder passa para 1 como N vai para o infinito quando nulo é falso) com o tamanho correto. Embora eu tenha um modelo de probabilidade (falso) para a distribuição amostral da média em tamanhos finitos de amostras, posso obter inferência válida e estimativa imparcial para aumentar meu "resumo útil dos dados" (a média).
Note-se que os testes baseados no IC95% para a mediana (ou seja, opção 6 na resposta de @ kjetilbhalvorsen) também contam com o teorema do limite central para mostrar que são consistentes. Portanto, não é uma loucura considerar o teste T simples como um teste "não paramétrico" ou "não baseado em probabilidade".
fonte
fonte