Gostaria de saber se o desvio padrão sempre foi construído com base na suposição de uma distribuição normal. Em outras palavras, se a amostra não for normalmente distribuída, o desvio padrão deve ser considerado um
Gostaria de saber se o desvio padrão sempre foi construído com base na suposição de uma distribuição normal. Em outras palavras, se a amostra não for normalmente distribuída, o desvio padrão deve ser considerado um
Digamos que temos dois vetores aleatórios gaussianos p(x1)=N(0,Σ1),p(x2)=N(0,Σ2)p(x1)=N(0,Σ1),p(x2)=N(0,Σ2)p(x_1) = N(0,\Sigma_1), p(x_2) = N(0,\Sigma_2) , existe um resultado bem conhecido para a expectativa de seu produto E[x1xT2]E[x1x2T]E[x_1x_2^T] sem assumir
A questão está praticamente contida no título. Qual é a distância de Mahalanobis para duas distribuições de matrizes de covariância diferentes? O que eu descobri até agora assume a mesma covariância para ambas as distribuições, ou seja, algo desse tipo: ΔTΣ−1ΔΔTΣ−1Δ\Delta^T \Sigma^{-1} \Delta E...
Suponha que você tenha uma turma de aproximadamente 800 alunos e, após um conjunto de avaliações, cada aluno tem uma nota bruta. Como essas notas brutas devem ser convertidas em uma nota final? É uma boa ideia dimensionar as notas brutas para uma distribuição
Estou interessado em uma família de distribuições multivariadas que podem ser vistas como uma generalização da distribuição normal multivariada, na medida em que são definidas por um valor de expectativa e uma matriz de covariância , além de uma função monotonamente decrescente modo que a densidade...
Desculpe pelo título longo, mas meu problema é bastante específico e difícil de explicar em um título. Atualmente, estou aprendendo sobre o Modelo Roy (análise de efeito do tratamento). Há uma etapa de derivação nos meus slides, que eu não entendo. Calculamos o resultado esperado com o...
Refiro-me a este post, que parece questionar a importância da distribuição normal dos resíduos, argumentando que isso, juntamente com a heterocedasticidade, poderia ser potencialmente evitado usando erros padrão robustos. Eu considerei várias transformações - raízes, logs etc. - e tudo está se...
Eu tenho dados que descrevem com que frequência um evento ocorre durante uma hora ("número por hora", nph) e quanto tempo os eventos duram ("duração em segundos por hora", dph). Estes são os dados originais: nph <- c(2.50000000003638, 3.78947368414551, 1.51456310682008, 5.84686774940732,...
Para uma curva em forma de sino de distribuição Normal, seria de se pensar que a altura deveria ter um valor ideal. Conhecer esse valor pode ser um indicador rápido para verificar se os dados são normalmente distribuídos. No entanto, não consegui encontrar seu valor formal. Na maioria dos lugares,...
Eu tento entender a idéia por trás da distribuição t. Aqui estão as etapas que eu entendi até agora: Utilizamos uma amostra de N elementos para estimar a média da população. Em mais detalhes, usamos a média da amostra como uma estimativa da média da população. Queremos saber o quão perto está...
Digamos que estamos interessados em como as notas dos exames dos alunos são afetadas pelo número de horas que esses alunos estudam. Amostra de alunos de várias escolas diferentes. o seguinte modelo de efeitos mistos: exam.gradesEu= a + β1× horas.estudoEu+ escolaj+
Como é bem conhecido pela distribuição normal, 68% da massa de probabilidade está dentro de um desvio padrão da média, 95% dentro de dois desvios padrão e 99,7% dentro de 3 desvios padrão. No entanto, tenho algumas distribuições empíricas que são leptocúrticas e assimétricas negativamente. Em...
Digamos que sabemos o significado de uma determinada distribuição. Isso afeta a estimativa de intervalo da variação de uma variável aleatória (que de outra forma é calculada usando a variação da amostra)? Como em, podemos obter um intervalo menor para o mesmo nível de
Descobri que, para um modelo de regressão linear simples, o OLS e o método de máxima verossimilhança (assumindo a distribuição Normal) fornecem a mesma saída (valores de parâmetros). A partir disso, podemos dizer que o OLS também faz suposições implícitas sobre a distribuição Normal ou vice-versa?...
Não entendo por que não posso simplesmente adicionar 1,5 desvios padrão para obter a resposta. Se 1 desvio padrão é 10 kg e a média é 400 kg, 415 kg são 1,5 desvios padrão. Então eu calculei assim: .3413 + ((.4772-.3413)/2) = 0.40925 Essa equação obtém metade da diferença entre dois desvios...
Atualmente, estou lendo artigos sobre PCA probabilístico e me pergunto por que o prior gaussiano (e não outro prior) é escolhido para as variáveis latentes? É apenas porque é simples ou há outro motivo? Referências: Tipping & Bishop, 1999, Análise Probabilística de Componentes Principais -...
Dada a probabilidade gaussiana de uma amostra como com sendo o espaço de parâmetro e , parametrizações arbitrárias do vetor médio e da matriz de covariância.yyyp(y|θ)=N(y;μ(θ),Σ(θ))p(y|θ)=N(y;μ(θ),Σ(θ))p(y|\theta) =
Como calcular o intervalo de confiança exato para o terceiro momento da distribuição normal ?N( a , σ2)N(a,σ2)N(a,
Gostaria de calcular P( Y= a X2+ b X+ c < 0
Eu li os ótimos comentários sobre como lidar com valores ausentes antes de aplicar o SVD, mas gostaria de saber como ele funciona com um exemplo simples: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 Dada a matriz acima, se eu remover os valores de NA, acabarei...