Estou confuso com a definição de modelo não paramétrico depois de ler este link Modelos paramétricos versus modelos não paramétricos e responder aos comentários da minha outra pergunta .
Originalmente, pensei que "paramétrico versus não paramétrico" significa se temos suposições de distribuição no modelo (semelhante ao teste de hipótese paramétrica ou não paramétrica). Mas ambos os recursos afirmam que "paramétrico versus não paramétrico" podem ser determinados se o número de parâmetros no modelo depende do número de linhas na matriz de dados.
Para a estimativa da densidade do kernel (não paramétrica), essa definição pode ser aplicada. Mas, sob essa definição, como uma rede neural pode ser um modelo não paramétrico, pois o número de parâmetros no modelo depende da estrutura da rede neural e não do número de linhas na matriz de dados?
Qual é exatamente a diferença entre um modelo paramétrico e um não paramétrico?
Respostas:
Em um modelo paramétrico, o número de parâmetros é fixo em relação ao tamanho da amostra. Em um modelo não paramétrico, o número (efetivo) de parâmetros pode aumentar com o tamanho da amostra.
Em uma regressão OLS, o número de parâmetros sempre será o comprimento de , mais um para a variação.β
Uma rede neural com arquitetura fixa e sem redução de peso seria um modelo paramétrico.
Mas se você tiver decaimento de peso, o valor do parâmetro de decaimento selecionado pela validação cruzada geralmente ficará menor com mais dados. Isso pode ser interpretado como um aumento no número efetivo de parâmetros com o aumento do tamanho da amostra.
fonte
Penso que se o modelo é definido como um conjunto de equações (pode ser um sistema de equações simultâneas ou uma única) e aprendemos seus parâmetros, então é paramétrico. Isso inclui equações diferenciais e até a equação de Navier-Stokes. Os modelos definidos descritivamente, independentemente de como são resolvidos, se enquadram na categoria de não paramétricos. Assim, o OLS seria paramétrico, e até a regressão quantílica, embora pertença ao domínio da estatística não paramétrica, é um modelo paramétrico.
Por outro lado, quando usamos o SEM (modelagem de equações estruturais) para identificar o modelo, ele seria um modelo não paramétrico - até que tenhamos resolvido o SEM. O PCA seria paramétrico, porque as equações são bem definidas, mas o CCA pode ser não paramétrico, porque estamos procurando correlações em todas as variáveis e, se são as correlações de Spearman, temos um modelo não paramétrico. Com as correlações de Pearson, sugerimos um modelo paramétrico (linear). Penso que os algoritmos de agrupamento seriam não paramétricos, a menos que procuremos agrupamentos de certa forma.
E então temos a regressão não paramétrica, que não é paramétrica, e a regressão LOESS, que é paramétrica, mas serve ao mesmo propósito: definimos a equação e a janela.
fonte
Modelo paramétrico podem ser emitidas usando uma equação, como modelo de regressão logística, . O modelo não paramétrico são algoritmos de caixa preta como floresta aleatória, árvore de decisão. Não existe uma equação que possa descrever a relação de atributos por trás do modelo.logodds(G)=int+ax1+bx2+...
fonte