Perguntas com a marcação «mean»

29
Como lidar com dados hierárquicos / aninhados no aprendizado de máquina

Vou explicar meu problema com um exemplo. Suponha que você queira prever a renda de um indivíduo, com alguns atributos: {Idade, Sexo, País, Região, Cidade}. Você tem um conjunto de dados de treinamento como esse train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2,...

29
Regressão à falácia média versus jogador

Por um lado, tenho a regressão à média e, por outro, tenho a falácia do jogador . A falácia de Gambler é definida por Miller e Sanjurjo (2019) como “a crença equivocada de que sequências aleatórias têm uma tendência sistemática à reversão, ou seja, que faixas de resultados semelhantes têm mais...

27
Os graus de liberdade podem ser um número não inteiro?

Quando uso o GAM, o DF residual é (última linha do código). O que isso significa? Indo além do exemplo do GAM, em geral, o número de graus de liberdade pode ser um número não inteiro?26,626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data =...

21
Como projetar um novo vetor no espaço PCA?

Depois de executar a análise de componentes principais (PCA), quero projetar um novo vetor no espaço do PCA (ou seja, encontrar suas coordenadas no sistema de coordenadas do PCA). Eu calculei o PCA na linguagem R usando prcomp. Agora eu devo poder multiplicar meu vetor pela matriz de rotação PCA....

20
Calcular média da variável ordinal

Eu li em vários lugares que o cálculo da média de uma variável ordinal é inadequado. Estou tentando entender por que isso pode ser inapropriado. Eu acho que é porque, em geral, uma variável ordinal não é normalmente distribuída e, portanto, calcular a média dará uma representação imprecisa. Alguém...

20
Valores médios de correlação

Digamos que eu teste como a variável Ydepende da variável Xsob diferentes condições experimentais e obtenho o seguinte gráfico: As linhas de traço no gráfico acima representam regressão linear para cada série de dados (configuração experimental) e os números na legenda indicam a correlação de...

20
Quais são os valores corretos para precisão e rechamada em casos extremos?

Precisão é definida como: p = true positives / (true positives + false positives) É verdade que, como true positivese false positivesabordagem 0, a precisão se aproxima de 1? Mesma pergunta para recall: r = true positives / (true positives + false negatives) No momento, estou implementando...