Sei que essa pergunta foi feita com o caso mean = median, mas não encontrei nada relacionado ao mean = mode. Se o modo for igual à média, posso sempre concluir que esta é uma distribuição simétrica? Serei obrigado a conhecer também a mediana dessa
Sei que essa pergunta foi feita com o caso mean = median, mas não encontrei nada relacionado ao mean = mode. Se o modo for igual à média, posso sempre concluir que esta é uma distribuição simétrica? Serei obrigado a conhecer também a mediana dessa
Vou explicar meu problema com um exemplo. Suponha que você queira prever a renda de um indivíduo, com alguns atributos: {Idade, Sexo, País, Região, Cidade}. Você tem um conjunto de dados de treinamento como esse train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2,...
Por um lado, tenho a regressão à média e, por outro, tenho a falácia do jogador . A falácia de Gambler é definida por Miller e Sanjurjo (2019) como “a crença equivocada de que sequências aleatórias têm uma tendência sistemática à reversão, ou seja, que faixas de resultados semelhantes têm mais...
Então, eu tenho um conjunto de dados de porcentagens assim: 100 / 10000 = 1% (0.01) 2 / 5 = 40% (0.4) 4 / 3 = 133% (1.3) 1000 / 2000 = 50% (0.5) Quero encontrar o desvio padrão das porcentagens, mas ponderado pelo volume de dados. ou seja, o primeiro e o último ponto de dados devem dominar o...
Quando uso o GAM, o DF residual é (última linha do código). O que isso significa? Indo além do exemplo do GAM, em geral, o número de graus de liberdade pode ser um número não inteiro?26,626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data =...
Eu quero derivar os limites para o intervalo de confiança de para a razão de duas médias. Suponha que e sejam independentes, a razão média . Tentei resolver: mas essa equação não pôde ser resolvida em muitos casos (sem raízes). Estou fazendo algo errado? Existe uma abordagem melhor? obrigadoX 1...
Ao executar o cluster hierárquico, é possível usar muitas métricas para medir a distância entre os clusters. Duas dessas métricas implicam o cálculo dos centróides e meios de pontos de dados nos clusters. Qual é a diferença entre a média e o centróide? Estes não são o mesmo ponto no...
Existe algo significativo sobre uma média geométrica e aritmética que caem muito próximas umas das outras, digamos ~ 0,1%? Que conjecturas podem ser feitas sobre esse conjunto de dados? Eu tenho trabalhado na análise de um conjunto de dados e percebo que, ironicamente, os valores são muito, muito...
Sei que se a mediana e a média são aproximadamente iguais, isso significa que há uma distribuição simétrica, mas neste caso em particular não tenho certeza. A média e a mediana estão bem próximas (apenas 0,487 m / gal de diferença), o que me levaria a dizer que há uma distribuição simétrica, mas...
Para variação não ponderada , existe a variação da amostra corrigida por viés, quando a média foi estimada a partir dos mesmos dados: Var(X):=1Var ( X) : = 1n∑Eu( xEu- μ )2Var(X): =1n∑Eu(xEu-μ)2\text{Var}(X):=\frac{1}{n}\sum_i(x_i - \mu)^2Var ( X) : = 1n - 1∑Eu( xEu- E[ X] )2Var(X):...
A Seção 1.7.2 de Descobrindo estatísticas usando R por Andy Fields, et all, ao listar virtudes de média versus mediana, declara: ... a média tende a ser estável em diferentes amostras. Depois de explicar as muitas virtudes da mediana, por exemplo, ... A mediana não é afetada por pontuações...
Muitos PDFs variam de menos a infinito positivo, mas alguns meios são definidos e outros não. Que característica comum torna
Depois de executar a análise de componentes principais (PCA), quero projetar um novo vetor no espaço do PCA (ou seja, encontrar suas coordenadas no sistema de coordenadas do PCA). Eu calculei o PCA na linguagem R usando prcomp. Agora eu devo poder multiplicar meu vetor pela matriz de rotação PCA....
Eu tenho 383 amostras que têm um viés pesado para alguns valores comuns, como eu calcularia o IC95% para a média? O IC que calculei parece muito distante, o que suponho é que meus dados não parecem uma curva quando eu faço um histograma. Então, acho que preciso usar algo como bootstrapping, que não...
Eu li em vários lugares que o cálculo da média de uma variável ordinal é inadequado. Estou tentando entender por que isso pode ser inapropriado. Eu acho que é porque, em geral, uma variável ordinal não é normalmente distribuída e, portanto, calcular a média dará uma representação imprecisa. Alguém...
O conceito de "média" percorre muito mais do que a média aritmética tradicional; estende até o ponto de incluir a mediana? Por analogia, dados brutos ⟶identidadedados brutos ⟶significarmédia bruta ⟶identidade- 1média aritméticadados brutos ⟶destinatáriorecíprocos ⟶significarrecíproco médio...
Se f1,…,fkf1,…,fkf_1,\ldots,f_k são densidades conhecidas das quais posso simular, ou seja, para as quais um algoritmo está disponível. e se o produto ∏i=1kfi(x)αiα1,…,αk>0∏i=1kfi(x)αiα1,…,αk>0\prod_{i=1}^k f_i(x)^{\alpha_i}\qquad \alpha_1,\ldots,\alpha_k>0 é integrável, existe uma abordagem...
Digamos que eu teste como a variável Ydepende da variável Xsob diferentes condições experimentais e obtenho o seguinte gráfico: As linhas de traço no gráfico acima representam regressão linear para cada série de dados (configuração experimental) e os números na legenda indicam a correlação de...
Precisão é definida como: p = true positives / (true positives + false positives) É verdade que, como true positivese false positivesabordagem 0, a precisão se aproxima de 1? Mesma pergunta para recall: r = true positives / (true positives + false negatives) No momento, estou implementando...
Alguns livros afirmam que um tamanho de amostra de tamanho 30 ou superior é necessário para que o teorema do limite central forneça uma boa aproximação para . X¯X¯\bar{X} Eu sei que isso não é suficiente para todas as distribuições. Desejo ver alguns exemplos de distribuições em que, mesmo com...