Estatísticas e Big Data

8
Qual é o propósito de usar uma árvore de decisão?

Não entendo qual é o objetivo da árvore de decisão? Do jeito que eu vejo, é uma série de if-else. Por que não uso apenas if-else em vez de usar uma árvore de decisão? É porque diminui a complexidade do meu código? Eu ainda sou poupado do cálculo da entropia e do ganho de informações, porque...

8
Função logística com uma inclinação, mas sem assíntotas?

A função logística possui uma faixa de saída de 0 a 1 e a inclinação assintótica é zero em ambos os lados. O que é uma alternativa a uma função logística que não fica completamente achatada em seus fins? Quais declives assintóticos estão se aproximando de zero, mas não de zero, e o alcance é...

8
Intuitivamente, como funciona o bootstrap selvagem?

Estou tentando entender a intuição por trás do bootstrap selvagem. O que ele está realmente fazendo? Eu preciso ser capaz de entender o que está tentando fazer em comparação com uma regressão convencional. Meus dados têm heterocedasticidade e o método que utilizo faz 5000 repetições. Como ele...

8
Sinal de Covariância e Rho de Spearman

Alguém tem uma prova de que a covariância entre duas variáveis sempre tem o mesmo sinal que Rho de Spearman, assumindo que ambas não são zero , ou uma explicação / contra-exemplo para mostrar por que não é esse o caso? Eu estou falando sobre as magnitudes da "população" (teórica), não sobre as...

8
Por que muitas pessoas desejam transformar dados distorcidos em dados distribuídos normais para aplicativos de aprendizado de máquina?

Para dados de imagem e tabulares, muitas pessoas transformam os dados distorcidos em dados normalmente distribuídos durante o pré-processamento. O que a distribuição normal significa no aprendizado de máquina? É uma suposição essencial de algoritmos de aprendizado de máquina? Até os dados da...

8
O problema do sapo (quebra-cabeça no vídeo do YouTube)

Há um quebra-cabeça interessante no vídeo do YouTube. Você pode resolver o problema do sapo? . Vou tentar dar uma formulação equivalente aqui. Um sapo está de um lado da lagoa e quer chegar do outro lado. Há folhas de lírio à frente em uma linha, a ésima licença que fica do outro lado da lagoa e é...

7
Correção de FDR quando os testes estão correlacionados

Eu tenho um conjunto de dados com pequeno número de amostras e grande número de variáveis. Fiz o teste de hipóteses (teste T) em cada uma das variáveis ​​e obtive vários valores de p. No entanto, as variáveis ​​estão correlacionadas entre si e a correção de FDR (procedimento de Benjamini-Hochberg)...