Estatísticas e Big Data

8

Diferença entre MLP (Multi-layer Perceptron) e Redes Neurais?

Eu estou pensando sobre as diferenças. Com base no meu entendimento, o MLP é um tipo de rede neural, onde a função de ativação é sigmóide e o termo de erro é um erro de entropia cruzada (logística). Procurando ajuda,

neural-networks perceptron

8

Interpolar dados binados de forma que a média da bandeja seja preservada

Digamos que eu tenha esses dados binados como entrada. O valor médio é fornecido para cada intervalo sucessivo de . Para simplificar, vamos assumir que a densidade de amostragem é uniforme dentro de cada compartimento.y¯iy¯i\bar{y}_iΔxiΔxi\Delta x_i Agora, quero estimar a função subjacente ( ), ou...

algorithms interpolation binning

8

Compare o modelo MLR com o modelo

Se eu tiver razões teóricas para supor que os dados possam se encaixar em uma equação incomum, como a seguinte: YEu= (β0 0+β1 1x1 i+β2x2 i+ϵEu)β3Yi=(β0+β1x1i+β2x2i+ϵi)β3Y_i = (\beta_0 + \beta_1x_{1i} + \beta_2x_{2i} + \epsilon_i)^{\beta_3} Posso usar a regressão linear múltipla de mínimos...

r regression nonlinear-regression

8

Como medir a precisão da previsão probabilística?

Suponha que eu faça um monte de previsões probabilísticas como: 70% de probabilidade de que o crescimento das vendas seja de 10 a 15% no primeiro trimestre, 10% de probabilidade de que o crescimento de vendas seja> 15%, 20% de probabilidade de que o crescimento de vendas seja <10% Dados...

forecasting scoring-rules

8

Qual é a diferença entre o regressor estocástico e o regressor não estocástico na regressão linear?

Suponha que a especificação de regressão seja yEu=β0 0+β1 1xEu+ϵEu,yi=β0+β1xi+ϵi,y_i=\beta_0+\beta_1x_i+\epsilon_i, Não importa xEuxix_i estocástico ou não, precisaremos assumir que ϵEuϵi\epsilon_i é distribuído da mesma forma para todos Euii. No entanto, sexEuxix_ié uma variável aleatória...

regression linear-model

8

Processos gaussianos com área de amostragem finita

Peço desculpas antecipadamente se esta pergunta for mal colocada: sou astrônomo, não estatístico. Minha pergunta tem como objetivo específico me ajudar a descobrir se os processos gaussianos são uma técnica apropriada para o meu problema. Usando um telescópio e um espectrógrafo alimentado por...

gaussian-process

8

Topologia de rede neural recorrente (RNN): por que sempre totalmente conectada?

Comecei a ler sobre Redes Neurais Recorrentes (RNNs) e Memória de Longo Prazo (LSTM) ... (... oh, não há pontos de representantes suficientes aqui para listar referências ...) Uma coisa que eu não entendo: sempre parece que os neurônios em cada instância de uma camada oculta ficam "totalmente...

machine-learning neural-networks backpropagation

8

Como executar a função 'lm' em R, mas com uma fórmula com apenas uma interceptação?

Eu tentei executar uma fórmula semelhante a y ~ 1. Isso me dá apenas uma interceptação, mas o valor mostrado é igual à estimativa de interceptação (sem covariáveis) + 1 ou apenas à estimativa de interceptação (sem covariáveis)? Qualquer ajuda seria

r regression

8

R: Gráfico de caixa na escala de log vs. transformação de log * e * criação de gráfico de caixa: Não obtém o mesmo resultado

Na boxplot()função em R, existe o log =argumento para especificar se um eixo deve ou não estar na escala de log. Para mim, se eu escolher esta opção (especificar log = "y"como argumento), a forma do gráfico de caixa deve ser a mesma que se eu transformas manualmente os dados primeiro com o log e,...

r data-transformation lognormal boxplot

8

O que é assimetria de uma distribuição?

O que é assimetria de uma distribuição? Pergunto por que alguns índices específicos parecem indecisos quanto à simetria e, em alguns casos, também à assimetria.

interpretation terminology skewness definition

8

Cálculo dos valores de probabilidade de emissão para o modelo de Markov oculto (HMM)

Eu sou novo no HMM e ainda estou aprendendo. Atualmente, estou usando o HMM para marcar parte do discurso. Para implementar o algoritmo viterbi, preciso de probabilidades de transição ( ai,jai,j a_{i,j} \newcommand{\Count}{\text{Count}} ) e de probabilidades de emissão ( bi(o)bi(o) b_i(o) ). Estou...

probability hidden-markov-model laplace-smoothing viterbi-algorithm

8

Intuição da constante de normalização bayesiana

No problema de triagem de mamografia comumente mencionado, com uma probabilidade de triagem de 80%, um valor anterior a 10% e uma taxa de falsos positivos de 50%, ou suas variantes, é fácil explicar que a probabilidade condicional posterior de uma triagem positiva indicar um câncer está presente é...

normalization bayes marginal

8

Redes neurais versus modelagem de equações estruturais Qual é a diferença?

Estou estudando sobre redes neurais artificiais (RNA) pela primeira vez e estou impressionado com a forma como os conceitos de redes neurais parecem ser semelhantes à modelagem de equações estruturais (SEM). Por exemplo, nós de entrada na RNA me lembram variáveis manifestas no SEM Nós ocultos...

machine-learning neural-networks sem

8

Definição de validade de uma variável instrumental

O que significa "validade de um instrumento" exatamente? No meu curso de econometria, acabamos de definir a validade do instrumento como , onde Z é a variável instrumental e uE[Z|u]=0E[Z|você]=0 0E[Z|u]=0ZZZuvocêu é o termo de erro de um modelo de regressão univariado. Depois, também falamos...

econometrics instrumental-variables

8

Como executar SVD para atribuir valores ausentes, um exemplo concreto

Eu li os ótimos comentários sobre como lidar com valores ausentes antes de aplicar o SVD, mas gostaria de saber como ele funciona com um exemplo simples: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 Dada a matriz acima, se eu remover os valores de NA, acabarei...

r missing-data data-imputation svd sampling matlab mcmc importance-sampling predictive-models prediction algorithms graphical-model graph-theory r regression regression-coefficients r-squared r regression modeling confounding residuals fitting glmm zero-inflation overdispersion optimization curve-fitting regression time-series order-statistics bayesian prior uninformative-prior probability discrete-data kolmogorov-smirnov r data-visualization histogram dimensionality-reduction classification clustering accuracy semi-supervised labeling state-space-models t-test biostatistics paired-comparisons paired-data bioinformatics regression logistic multiple-regression mixed-model random-effects-model neural-networks error-propagation numerical-integration time-series missing-data data-imputation probability self-study combinatorics survival cox-model statistical-significance wilcoxon-mann-whitney hypothesis-testing distributions normal-distribution variance t-distribution probability simulation random-walk diffusion hypothesis-testing z-test hypothesis-testing data-transformation lognormal r regression agreement-statistics classification svm mixed-model non-independent observational-study goodness-of-fit residuals confirmatory-factor neural-networks deep-learning

8

Qual é o sentido de dividir os dados em partes de treinamento e teste para avaliar as propriedades de previsão quando temos a AIC?

Assintoticamente, minimizar o AIC é equivalente a minimizar o MSE de validação cruzada de exclusão única para dados transversais [ 1 ]. Então, quando temos a AIC, por que alguém usa o método de dividir os dados em conjuntos de treinamento, validação e teste para medir as propriedades preditivas dos...

predictive-models aic

8

Por que usar probabilidades e não probabilidades na regressão logística?

Por que usaríamos probabilidades em vez de probabilidades ao realizar regressão

regression logistic odds

8

Por que os erros padrão são enviesados para baixo ao considerar instrumentos fracos

Fiquei me perguntando por que os erros padrão são (severamente) enviesados para baixo quando você usa o estimador de variável instrumental (geral) ou o estimador de método generalizado de momentos

estimation instrumental-variables generalized-moments

8

Dessazonalizando dados com análise de fourier

Eu tenho um dado que tem dois comportamentos subjacentes. Primeiro, há uma periodicidade nele. Parece uma curva senoidal. Em segundo lugar, os pontos de dados têm crescimento constante. Portanto, se eu tiver 100 pontos de dados sem crescimento, será semelhante a uma curva senoidal. Mas devido à...

time-series seasonality trend fourier-transform

8

Rastreio de probabilidade estranha da cadeia MCMC

Eu tenho um modelo que vai: Single parameter -> Complex likelihood function -> Log-likelihood. Executei uma cadeia MCMC (usando o pymc) e plotei o rastreamento do parâmetro e a probabilidade de log. A estimativa de parâmetros acabou sendo razoável, mas o gráfico de probabilidade de log parece...

mcmc likelihood