Considere o caso descrito abaixo, de Peacock (1972). Essa passagem parece implicar que o jovem estatístico está fazendo uma declaração inteligente e correta. Mas ele
Considere o caso descrito abaixo, de Peacock (1972). Essa passagem parece implicar que o jovem estatístico está fazendo uma declaração inteligente e correta. Mas ele
No Deep Learning de François Chollet com Python, ele diz: Como resultado, o ajuste da configuração do modelo com base em seu desempenho no conjunto de validação pode resultar rapidamente na adaptação excessiva ao conjunto de validação, mesmo que seu modelo nunca seja treinado diretamente sobre...
Descrição geral Um estimador eficiente (que tem variação de amostra igual ao limite Cramér – Rao) maximiza a probabilidade de estar próximo ao parâmetro verdadeiro ?θθ\theta Digamos que comparemos a diferença ou diferença absoluta entre a estimativa e o parâmetro verdadeiroΔ^=θ^-...
Antes de tudo, percebo que minha pergunta é muito ampla e que pode ser difícil responder a essa pergunta por causa disso. Você tem algum conselho sobre como abordar um 'problema' em que precisa fazer previsões / previsões para mais de 2000 produtos diferentes? Em outras palavras, cada produto...
Nos documentos de aprendizado do scikit sobre calibração de probabilidade, eles comparam a regressão logística com outros métodos e observam que a floresta aleatória é menos bem calibrada que a regressão logística. Por que a regressão logística é bem calibrada? Como alguém poderia arruinar a...
Foi-me feita a seguinte pergunta por um amigo. Não pude ajudá-la, mas espero que alguém possa me explicar. Não encontrei nenhum exemplo semelhante. Obrigado por qualquer ajuda e explicação. P: Os resultados de 100 experimentos de sorteio são registrados como 0 = "Cauda" e 1 = "Cabeça". A saída x é...
Considere o Bayesian posterior . Assintoticamente, seu máximo ocorre na estimativa MLE , que apenas maximiza a probabilidade .θ∣Xθ∣X\theta\mid Xθ^θ^\hat \thetaargminθfθ(X)argminθfθ(X)\operatorname{argmin}_\theta\, f_\theta(X) Todos esses conceitos - priores Bayesianos, maximizando a probabilidade...
Estou trabalhando em um problema de inferência de alta dimensão (em torno de 2000 parâmetros do modelo) para o qual somos capazes de executar com precisão a estimativa de MAP encontrando o máximo global do log-posterior usando uma combinação de otimização baseada em gradiente e um algoritmo...
Suponha que e são variáveis aleatórias geométricas independentes com o parâmetro . Qual é a probabilidade de ?X1 1X1 1X_1X2X2X_2pppX1 1≥ X2X1 1≥X2X_1 \geq X_2 Estou confuso com esta pergunta porque não nos disseram nada sobre o e o que não sejam geométricos. Isso não seria porque e podem...
Eu tenho lido o artigo original sobre desistência, ( https://www.cs.toronto.edu/~hinton/absps/JMLRdropout.pdf ) e na seção de regressão linear, afirma-se que: ER∼Bernoulli(p)[∥y −(R∗X)w∥2]ER∼Bernoulli(p)[‖y −(R∗X)w‖2]\mathbb{E}_{R\sim Bernoulli(p)}\left[\| y\ - (R*X)w\|^2\right] reduz...
Estou aprendendo sobre os modelos de mistura gaussiana (GMM), mas estou confuso sobre o motivo pelo qual alguém deveria usar esse algoritmo. Como esse algoritmo é melhor do que outro algoritmo padrão de cluster, como significa quando se trata de clustering? O significa que o algoritmo particiona...
Então, eu tenho lido alguns livros (ou partes deles) sobre modelagem ("Estratégias de modelagem de regressão" de F. Harrell, entre outros), já que minha situação atual é que preciso fazer um modelo logístico baseado em dados de resposta binária. Eu tenho dados contínuos, categóricos e binários...
Pesquisei um pouco no Google, mas não encontrei nada sobre isso. Suponha que você faça uma regressão do quantil no quinto quinto da variável dependente. Em seguida, você divide o DV no quinto quantil e rotula o resultado 0 e 1. Em seguida, você faz a regressão logística no DV...
Suponha que eu tenha três grupos independentes, com média μ1 1, μ 2, μ 3μ1, μ2, μ3\mu_1,~ \mu_2,~\mu_3 respectivamente. Como posso testar se ou não está usando amostras de cada grupo?μ1 1< μ2< μ3μ1<μ2<μ3\mu_1 < \mu_2
Estou tentando obter uma intuição mais clara por trás: "Se torna mais provável, então torna mais provável"UMAAABBBBBBUMAAA Seja o tamanho do espaço em que e estão, entãon ( S)n(S)n(S)UMAAABBB Reivindicação: entãoP( B | A ) > P( B )P(B|A)>P(B)P(B|A)>P(B)n ( A B ) / n ( A ) > n ( B ) /...
Atualmente aprendendo regressão de cordilheira e fiquei um pouco confuso sobre a penalização de modelos mais complexos (ou a definição de um modelo mais complexo). Pelo que entendi, a complexidade do modelo não se correlaciona necessariamente com a ordem polinomial. Portanto:...
Encontrei uma solução que afirmava que, se o quadrado de uma série temporal é estacionário, o mesmo ocorre com a série temporal original e vice-versa. No entanto, eu não pareço provar isso, alguém tem uma idéia se isso é verdade e se é como derivar
Estou trabalhando no modelo de regressão logística. A partir de agora, você terá acesso a todas as informações necessárias para que você tenha uma experiência de compra agradável e que atenda às suas necessidades. ? Um sênior meu sugeriu fazer a transformação logarítmica da variável insignificante...
Existem muitas perguntas (como esta ) sobre alguma ambiguidade com a fórmula bayesiana em caso contínuo. p(θ|x)=p(x|θ)⋅p(θ)p(x)p(θ|x)=p(x|θ)⋅p(θ)p(x)p(\theta | x) = \frac{p(x | \theta) \cdot p(\theta)}{p(x)} Muitas vezes, a confusão surge do fato de que a definição da distribuição condicional...
Imagine que você tem um polígono definido por um conjunto de coordenadas e seu centro de massa é . Você pode tratar o polígono como uma distribuição uniforme com um limite poligonal. (x1,y1)...(xn,yn)(x1,y1)...(xn,yn)(x_1,y_1)...(x_n,y_n)(0,0)(0,0)(0,0) Estou atrás de um método que encontrará a...