Estatísticas e Big Data

9
Quais critérios usar para separar variáveis ​​em variáveis ​​explicativas e respostas para métodos de ordenação em ecologia?

Eu tenho diferentes variáveis ​​que interagem dentro de uma população. Basicamente, tenho feito um inventário de milípedes e medido alguns outros valores do terreno, como: As espécies e a quantidade de espécimes coletados Os diferentes ambientes onde os animais estão o pH A porcentagem de...

9
Dimensão VC de um retângulo

O livro "Introdução ao aprendizado de máquina" de Ethem Alpaydın afirma que a dimensão VC de um retângulo alinhado ao eixo é 4. Mas como um retângulo pode quebrar um conjunto de quatro pontos colineares com pontos positivos e negativos alternativos? Alguém pode explicar e provar a dimensão VC de...

9
Derivação interessante de R ao quadrado

Anos atrás, eu encontrei essa identidade através da experimentação brincando com dados e transformações. Depois de explicar ao meu professor de estatística, ele entrou na aula seguinte com uma prova de uma página, usando notação de vetor e matriz. Infelizmente, perdi o papel que ele me deu. (Isso...

9
Suficiência ou Insuficiência

Considere uma amostra aleatória que são as variáveis ​​aleatórias iid que . Verifique se é uma estatística suficiente para .{X1,X2,X3}{X1,X2,X3}\{X_1,X_2,X_3\}XiXiX_iBernoulli(p)Bernoulli(p)Bernoulli(p)p∈(0,1)p∈(0,1)p\in(0,1)T(X)=X1+2X2+X3T(X)=X1+2X2+X3T(X)=X_1+2X_2+X_3ppp Em primeiro lugar,...

9
Sobreposição de rede neural

Aprendi que o ajuste excessivo pode ser detectado plotando o erro de treinamento e o erro de teste versus as épocas. Como em: Eu estive lendo este post do blog onde eles dizem que a rede neural, net5 é excessiva e eles fornecem esta figura: O que é estranho para mim, já que o erro de...

9
Interpretação de causalidade de Granger usando R

Eu tenho três variáveis ​​macroeconômicas (ICS - sentimento do consumidor, ER - taxa de emprego, DGO - pedido de bens duráveis) e executei testes de causalidade de Granger em R sobre eles. Eu realmente não sei como interpretar os resultados de um teste de Granger. Alguém poderia me ajudar com a...

9
A amostragem baseada em cadeia de Markov é a "melhor" para a amostragem de Monte Carlo? Existem esquemas alternativos disponíveis?

Cadeia de Markov Monte Carlo é um método baseado em cadeias de Markov que nos permite obter amostras (em um cenário de Monte Carlo) de distribuições não padronizadas das quais não podemos extrair amostras diretamente. Minha pergunta é por que a cadeia de Markov é "avançada" na amostragem de Monte...