No aprendizado por reforço, nosso objetivo é otimizar a função de valor de estado ou função de valor de ação, definidas da seguinte forma: Vπs= ∑ p ( s′| s,π( s ) ) [ r ( s′| s,π( s ) ) + γVπ( s′) ] = Eπ[ r ( s′|s,a)+γVπ(s′)|s0= s
No aprendizado por reforço, nosso objetivo é otimizar a função de valor de estado ou função de valor de ação, definidas da seguinte forma: Vπs= ∑ p ( s′| s,π( s ) ) [ r ( s′| s,π( s ) ) + γVπ( s′) ] = Eπ[ r ( s′|s,a)+γVπ(s′)|s0= s
O Natal está chegando e eu gostaria de fazer um presente com estatísticas. O destinatário comprou e gostou de Como não ser errado, de Jordan Ellenberg (aliás, eu também gosto desse livro). Ele também gostava de The Signal and the Noise , embora achasse um pouco de matemática. Portanto, estou...
A Nature publicou este ano o seguinte artigo: Evidências de um limite para a vida útil humana 1 , na qual os autores argumentam que "os resultados sugerem fortemente que a vida útil máxima dos seres humanos é fixa e sujeita a restrições naturais". Uma das análises estatísticas deste artigo já foi...
Estou trabalhando em visão computacional e preciso otimizar uma função objetiva que envolve a matriz e a matriz é uma matriz ortogonal.XXXXXX maximize f(X)maximize f(X)maximize \ \ f(X) s.t XTX=Is.t XTX=I s.t \ \ X^T X=I Onde é a matriz da unidade. Estou lendo alguns artigos e eles falavam...
Vamos começar assumindo que eu tenho dados transversais em , , (veja abaixo , , ).yyyx1x1x_1x2x2x_2yyyx1x1x_1x2x2x_2 Quero estimar o efeito das variáveis e e sua interação ( ) na variável usando a abordagem da função de controle, e é altamente provável que e sejam endógenas. Eu tenho dois...
Novo no aprendizado estatístico e de máquina e em alguns cursos on-line. Estou tentando entender a regressão logística com mais detalhes e notei uma diferença na fórmula entre o curso de Andrew Ng e o curso de aprendizagem estatística de Stanford. Abaixo, eu posto uma imagem de link nas duas...
Entendo que o sensor comprimido encontra a solução mais esparsa para onde , e , .X ∈ R D Um ∈ R k x D y ∈ R k k < < Dy=Axy=Axy = Axx∈RDx∈RDx \in \mathbb{R}^DA∈Rk×DA∈Rk×DA \in \mathbb{R}^{k \times D}y∈Rky∈Rky \in \mathbb{R}^{k}k<<Dk<<Dk
Qual seria a distribuição da seguinte equação: y= a2+ 2 a d+ d2y=a2+2ad+d2y = a^2 + 2ad + d^2 onde e são variáveis aleatórias qui-quadrado independentes não centrais com graus de liberdade.d 2 Mumaaaddd2 M2M2 \textbf{M} OBS .: Os rv que geram e têm e , digamos .d μ = 0 σ 2 ≠ 1 σ 2 = cumaaadddμ...
Eu tenho uma pergunta sobre o coeficiente de inclinação do OLS comparado ao da Regressão Quantil, ao enfrentar termos de erro homoscedástico. O modelo de população pode se parecer com: yEu=β0 0+β1 1xEu+vocêEuyi=β0+β1xi+uiy_i = \beta_0 + \beta_{1}x_i + u_i com vocêEuuiu_isendo termos de erro do...
Eu executei o laço e, em seguida, validação cruzada cv<-cv.glmnet(df, df$Price, nfolds = 1500) Quando plogo cv, obtenho o seguinte: Notei também que recebo 2 lambdas diferentes: lambda.minelambda.1se Qual é a diferença entre essas lambdas? O que posso entender da plotagem acima em geral...
Eu vi a seguinte justificativa para o teste de Wald da hipótese nula para um parâmetro escalar . Quando θ n é o MTE para θ estimada a partir de uma amostra independente de tamanho n , sob a hipótese nula temos √ θH0:θ=θ0H0:θ=θ0H_0: \theta = \theta_0θθ\thetaθ^nθ^n\hat{\theta}_nθθ\thetannnna...
Em geral, se tivermos um grande conjunto de dados, podemos dividi-lo em (1) treinamento, (2) validação e (3) teste. Usamos a validação para identificar os melhores hiperparâmetros na validação cruzada (por exemplo, C no SVM) e, em seguida, treinamos o modelo usando os melhores hiperparâmetros com o...
especialistas! Talvez você saiba como calcular o intervalo de confiança para xgboost? A fórmula clássica com distribuição t não pode ajudar, porque meus dados não são normalmente distribuídos. Ou não importa? Se você sugerir alguma literatura, será muito útil, mas as abordagens em R e Python (no...
Digamos que é uma variável aleatória com covariância . Por definição , as entradas da matriz de covariância são covariâncias: Além disso, sabe-se que as entradas da precisão satisfazem: onde o lado direito é a covariância de com condicionado em todas as outras variáveis.X∈RnX∈RnX \in...
Eu queria estimar o intervalo de confiança para o desvio padrão para alguns dados. O código R tem a seguinte aparência: library(boot) sd_boot <- function (x, ind) { res <- sd(x$ReadyChange[ind], na.rm = TRUE) return(res) } data_boot <- boot::boot(data, statistic = sd_boot, R =...
Eu tenho um problema de classificação binária (aprendizado supervisionado), onde todos os meus recursos são booleanos, com o seguinte toque: Eu quero aprender um classificador que é monótono . Em outras palavras, alterar qualquer subconjunto de recursos de 0 para 1 nunca deve alterar a saída do...
A chegada de fótons a um pixel em um sensor de imagem é uma variável aleatória distribuída de Poisson, de modo que a entrada possa ser modelada como uma Poisson rv .X~ P o i s s o n ( λ )X∼Poisson(λ)X\sim \mathrm{Poisson}(\lambda) Como a entrada é Poisson, a média e a variância são iguais para...
Ao executar a análise exploratória dos dados, frequentemente imprimirei os gráficos e escreverei comentários / anotações etc. As pessoas têm sugestões para uma melhor metodologia eletrônica? Estou especialmente interessado em python / R. Estou procurando por algo 'rápido (e sujo)' que não diminua...
Esta pergunta é referente ao documento Deepmind sobre DDPG: https://arxiv.org/pdf/1509.02971v5.pdf . A maioria (todas?) Das implementações do algoritmo DDPG que eu vi computam a atualização do gradiente na rede do ator por
Estou um pouco confuso com a fórmula para calcular a covariância no processo gaussiano (a adição de variação sempre me confunde, pois nem sempre é explicitamente indicada). A origem da confusão é que as fórmulas fornecidas no processo de reconhecimento de padrões e aprendizado de máquina por Bishop...