Eu estou pensando sobre as diferenças. Com base no meu entendimento, o MLP é um tipo de rede neural, onde a função de ativação é sigmóide e o termo de erro é um erro de entropia cruzada (logística). Procurando ajuda,
Eu estou pensando sobre as diferenças. Com base no meu entendimento, o MLP é um tipo de rede neural, onde a função de ativação é sigmóide e o termo de erro é um erro de entropia cruzada (logística). Procurando ajuda,
Digamos que eu tenha esses dados binados como entrada. O valor médio é fornecido para cada intervalo sucessivo de . Para simplificar, vamos assumir que a densidade de amostragem é uniforme dentro de cada compartimento.y¯iy¯i\bar{y}_iΔxiΔxi\Delta x_i Agora, quero estimar a função subjacente ( ), ou...
Se eu tiver razões teóricas para supor que os dados possam se encaixar em uma equação incomum, como a seguinte: YEu= (β0 0+β1 1x1 i+β2x2 i+ϵEu)β3Yi=(β0+β1x1i+β2x2i+ϵi)β3Y_i = (\beta_0 + \beta_1x_{1i} + \beta_2x_{2i} + \epsilon_i)^{\beta_3} Posso usar a regressão linear múltipla de mínimos...
Suponha que eu faça um monte de previsões probabilísticas como: 70% de probabilidade de que o crescimento das vendas seja de 10 a 15% no primeiro trimestre, 10% de probabilidade de que o crescimento de vendas seja> 15%, 20% de probabilidade de que o crescimento de vendas seja <10% Dados...
Suponha que a especificação de regressão seja yEu=β0 0+β1 1xEu+ϵEu,yi=β0+β1xi+ϵi,y_i=\beta_0+\beta_1x_i+\epsilon_i, Não importa xEuxix_i estocástico ou não, precisaremos assumir que ϵEuϵi\epsilon_i é distribuído da mesma forma para todos Euii. No entanto, sexEuxix_ié uma variável aleatória...
Peço desculpas antecipadamente se esta pergunta for mal colocada: sou astrônomo, não estatístico. Minha pergunta tem como objetivo específico me ajudar a descobrir se os processos gaussianos são uma técnica apropriada para o meu problema. Usando um telescópio e um espectrógrafo alimentado por...
Comecei a ler sobre Redes Neurais Recorrentes (RNNs) e Memória de Longo Prazo (LSTM) ... (... oh, não há pontos de representantes suficientes aqui para listar referências ...) Uma coisa que eu não entendo: sempre parece que os neurônios em cada instância de uma camada oculta ficam "totalmente...
Eu tentei executar uma fórmula semelhante a y ~ 1. Isso me dá apenas uma interceptação, mas o valor mostrado é igual à estimativa de interceptação (sem covariáveis) + 1 ou apenas à estimativa de interceptação (sem covariáveis)? Qualquer ajuda seria
Na boxplot()função em R, existe o log =argumento para especificar se um eixo deve ou não estar na escala de log. Para mim, se eu escolher esta opção (especificar log = "y"como argumento), a forma do gráfico de caixa deve ser a mesma que se eu transformas manualmente os dados primeiro com o log e,...
O que é assimetria de uma distribuição? Pergunto por que alguns índices específicos parecem indecisos quanto à simetria e, em alguns casos, também à assimetria.
Eu sou novo no HMM e ainda estou aprendendo. Atualmente, estou usando o HMM para marcar parte do discurso. Para implementar o algoritmo viterbi, preciso de probabilidades de transição ( ai,jai,j a_{i,j} \newcommand{\Count}{\text{Count}} ) e de probabilidades de emissão ( bi(o)bi(o) b_i(o) ). Estou...
No problema de triagem de mamografia comumente mencionado, com uma probabilidade de triagem de 80%, um valor anterior a 10% e uma taxa de falsos positivos de 50%, ou suas variantes, é fácil explicar que a probabilidade condicional posterior de uma triagem positiva indicar um câncer está presente é...
Estou estudando sobre redes neurais artificiais (RNA) pela primeira vez e estou impressionado com a forma como os conceitos de redes neurais parecem ser semelhantes à modelagem de equações estruturais (SEM). Por exemplo, nós de entrada na RNA me lembram variáveis manifestas no SEM Nós ocultos...
O que significa "validade de um instrumento" exatamente? No meu curso de econometria, acabamos de definir a validade do instrumento como , onde Z é a variável instrumental e uE[Z|u]=0E[Z|você]=0 0E[Z|u]=0ZZZuvocêu é o termo de erro de um modelo de regressão univariado. Depois, também falamos...
Eu li os ótimos comentários sobre como lidar com valores ausentes antes de aplicar o SVD, mas gostaria de saber como ele funciona com um exemplo simples: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 Dada a matriz acima, se eu remover os valores de NA, acabarei...
Assintoticamente, minimizar o AIC é equivalente a minimizar o MSE de validação cruzada de exclusão única para dados transversais [ 1 ]. Então, quando temos a AIC, por que alguém usa o método de dividir os dados em conjuntos de treinamento, validação e teste para medir as propriedades preditivas dos...
Por que usaríamos probabilidades em vez de probabilidades ao realizar regressão
Fiquei me perguntando por que os erros padrão são (severamente) enviesados para baixo quando você usa o estimador de variável instrumental (geral) ou o estimador de método generalizado de momentos
Eu tenho um dado que tem dois comportamentos subjacentes. Primeiro, há uma periodicidade nele. Parece uma curva senoidal. Em segundo lugar, os pontos de dados têm crescimento constante. Portanto, se eu tiver 100 pontos de dados sem crescimento, será semelhante a uma curva senoidal. Mas devido à...
Eu tenho um modelo que vai: Single parameter -> Complex likelihood function -> Log-likelihood. Executei uma cadeia MCMC (usando o pymc) e plotei o rastreamento do parâmetro e a probabilidade de log. A estimativa de parâmetros acabou sendo razoável, mas o gráfico de probabilidade de log parece...