Alguém conhece o exemplo de um algoritmo proposto por Williams no artigo "Uma classe de algoritmos de estimativa de gradiente para aprendizado por reforço em redes neurais"
Alguém conhece o exemplo de um algoritmo proposto por Williams no artigo "Uma classe de algoritmos de estimativa de gradiente para aprendizado por reforço em redes neurais"
Depois de mostrarmos que duas quantidades estão correlacionadas, como inferimos que o relacionamento é causal? E, além disso, qual causa o quê? Agora, em teoria, pode-se usar uma "atribuição aleatória" (seja qual for a palavra certa), para quebrar qualquer vínculo de acidente que possa existir...
Eu tenho um conjunto de dados tridimensionais e estou tentando usar a análise do fator externo externo para identificar os valores mais únicos ou estranhos. Como alguém decide o valor k a ser usado na análise LOF? Entendo o que o valor k determina e, portanto, não estou surpreso por ver resultados...
Estou procurando um pacote para me ajudar a resolver alguns problemas de otimização quadrática e vejo que há pelo menos meia dúzia de pacotes diferentes. De acordo com esta página: QP (programação quadrática, 90C20): cplexAPI , kernlab , limSolve , LowRankQP , quadprog , Rcplex , Rmosek Alguns...
Quero treinar uma rede neural com uma sequência de caracteres como um vetor de entrada. Os exemplos de aprendizado têm duração diferente e, por esse motivo, não sei como representá-los. Digamos que eu tenha dois exemplos de sequências, aqui os nomes: john doe maurice delanoe O primeiro exemplo...
Eu tenho um conjunto de dados com todas as chamadas feitas para um serviço de emergência e os tempos de resposta do departamento de ambulância. Eles admitiram que existem alguns erros nos tempos de resposta, pois há casos em que eles não começaram a gravar (portanto, o valor é 0) ou em que não...
Na filogenética, as árvores filogenéticas são frequentemente construídas usando MLE ou análise bayesiana. Muitas vezes, um plano prévio é usado na estimativa bayesiana. Pelo que entendi, uma estimativa bayesiana é uma estimativa de probabilidade que incorpora uma prévia. Minha pergunta é: se você...
Um tópico recente de discussão recente diz respeito a uma revista que proíbe o uso de "procedimentos de teste estatístico de hipóteses nulas (NHSTPs)" de artigos submetidos à revista. Vejo esse termo usado por alguns escritores, mas não entendo que distinção eles estão tentando fazer. Um NHSTP é...
Meus dados brutos consistem em uma série temporal de 60 dias com uma tendência de queda. Os dados são semanais, portanto a frequência é definida como 7. Eu calculei a diferença dos dados que se parece com isso Quando executo gráficos de ACF e PACF sobre a diferença, pareço obter resultados...
Na CNN, aprenderemos filtros para produzir um mapa de características na camada convolucional. No Autoencoder, a única unidade oculta de cada camada pode ser considerada como filtro. Qual a diferença entre os filtros aprendidos nessas duas
Estou tentando entender a forma normalizada de informações mútuas pontuais. n p m i = p m i ( x , y)l o g( p ( x , y) ))npmEu=pmEu(x,y)euog(p(x,y))npmi = \frac{pmi(x,y)}{log(p(x,y))} Por que a probabilidade conjunta de log normaliza as informações mútuas pontuais entre [-1, 1]? As informações...
Meu objetivo é analisar os logs de rede (por exemplo, Apache, syslog, auditoria de segurança do Active Directory e assim por diante) usando a detecção de cluster / anomalia para fins de detecção de intrusão. Nos logs, tenho muitos campos de texto como endereço IP, nome de usuário, nome do host,...
Para testes t, de acordo com a maioria dos textos, há uma suposição de que os dados da população são normalmente distribuídos. Não vejo por que isso é. Um teste t não exige apenas que a distribuição amostral da média amostral seja normalmente distribuída, e não a população? Se o teste t exigir...
Uso a decomposefunção Re crio os três componentes da minha série temporal mensal (tendência, sazonal e aleatória). Se plotar o gráfico ou olhar para a tabela, posso ver claramente que a série temporal é afetada pela sazonalidade. No entanto, quando regredo a série temporal para as 11 variáveis...
A perda de L2, juntamente com a perda de L0 e L1, são três funções de perda "padrão" muito comuns usadas ao resumir uma posterior pela mínima perda posterior esperada. Uma razão para isso é talvez o fato de serem relativamente fáceis de calcular (pelo menos para distribuições 1d), L0 resulta no...
Eu tenho uma variável dependente que pode variar de 0 a infinito, com 0s sendo realmente observações corretas. Entendo que os modelos de censura e Tobit só se aplicam quando o valor real de é parcialmente desconhecido ou ausente, caso em que os dados são considerados truncados. Mais algumas...
Estou tentando entender melhor os campos receptivos da CNN. Para fazer isso, gostaria de calcular o campo receptivo de cada neurônio no LeNet. Para um MLP normal, é bastante fácil (consulte http://deeplearning.net/tutorial/lenet.html#sparse-connectivity ), mas é mais difícil calcular o campo...
Eu sei que a variação da diferença de duas variáveis independentes é a soma das variações, e eu posso provar isso. Eu quero saber onde a covariância vai no outro
Eu tenho um modelo de mistura no qual desejo encontrar o estimador de probabilidade máxima de um dado conjunto de dados e um conjunto de dados parcialmente observados . Eu implementei a etapa E (calculando a expectativa de z dado x e os parâmetros atuais \ theta ^ k ) e a etapa M, para minimizar a...
Estou simulando ensaios de Bernoulli com um aleatório entre grupos e, em seguida, encaixo o modelo correspondente em o pacote:logitθ∼N(logitθ0,12)logitθ∼N(logitθ0,12)\text{logit}\, \theta \sim {\cal N}(\text{logit}\, \theta_0, 1^2)lme4 library(lme4) library(data.table) I <- 30 # number of...