Normalmente, somos apresentados ao método de estimadores de momentos "equiparando os momentos da população à sua amostra" até estimarmos todos os parâmetros da população; de modo que, no caso de uma distribuição normal, precisaríamos apenas do primeiro e do segundo momento, porque eles descrevem completamente essa distribuição.
E poderíamos, teoricamente, computar até momentos adicionais como:
Como posso criar intuição para quais momentos realmente são? Eu sei que eles existem como um conceito em física e em matemática, mas não acho que seja diretamente aplicável, principalmente porque não sei como fazer a abstração do conceito de massa para um ponto de dados. O termo parece ser usado de maneira específica em estatística, que difere do uso em outras disciplinas.
Que característica dos meus dados determina quantos ( ) momentos existem no geral?
Respostas:
Faz muito tempo desde que fiz uma aula de física, então me informe se algo está incorreto.
Descrição geral de momentos com análogos físicos
Dê uma variável aleatória, . O n- ésimo momento de X em torno de c é: m n ( c ) = E [ ( X - c ) n ] Isso corresponde exatamente ao sentido físico de um momento. Imagine X como uma coleção de pontos ao longo da linha real com a densidade fornecida pelo pdf. Coloque um ponto de apoio sob esta linha em ce comece a calcular os momentos relativos a esse ponto de apoio, e os cálculos corresponderão exatamente aos momentos estatísticos.X n X c
A maior parte do tempo, o momento -ésimo de X refere-se ao momento em torno de 0 (momentos em que o ponto de apoio é colocado em 0): m n = E [ X n ] O n -simo centro momento de X é: m N = m n ( m 1 ) = E [ ( X - m 1 ) n ]n X
O -simo padronizado momento de X é: ~ m n = m nn X
Novamente, isso escala momentos pela disseminação da distribuição, permitindo uma interpretação mais fácil especificamente da curtose. O primeiro momento padronizado será sempre zero, o segundo sempre será um. Isso corresponde ao momento do escore padrão (escore z) de uma variável. Eu não tenho um ótimo analógico físico para esse conceito.
Momentos comumente usados
Para qualquer distribuição, há potencialmente um número infinito de momentos. Momentos suficientes quase sempre caracterizam e distribuem totalmente (derivar as condições necessárias para que isso seja certo faz parte do problema do momento ). Em geral, são discutidos quatro momentos em estatísticas:
Raramente falamos de momentos além da curtose, precisamente porque há muito pouca intuição neles. Isso é semelhante aos físicos que param após o segundo momento.
fonte
Este é um tópico antigo, mas desejo corrigir uma distorção no comentário de Fg Nu, que escreveu "Os momentos são parametrizados pelos números naturais e caracterizam completamente uma distribuição".
Momentos NÃO caracterizam completamente uma distribuição. Especificamente, o conhecimento de todo o número infinito de momentos, mesmo que existam, não determina necessariamente exclusivamente a distribuição.
De acordo com meu livro de probabilidades favorito, Feller "Uma Introdução à Teoria das Probabilidades e Suas Aplicações Vol. II" (veja minha resposta em exemplos da vida real de distribuições comuns ), seção VII.3 exemplo nas páginas 227-228, o Lognormal não é determinado por seus momentos, significando que existem outras distribuições com todo número infinito de momentos iguais às Lognormal, mas com funções de distribuição diferentes. Como é amplamente conhecido, a Função Geradora de Momentos não existe para o Lognormal, nem para essas outras distribuições que possuem os mesmos momentos.
diverge. Observe que este não é um se e somente se. Essa condição não se aplica ao Lognormal e, de fato, não é determinada por seus momentos.
Por outro lado, as distribuições (variáveis aleatórias) que compartilham todo o número infinito de momentos, só podem diferir muito, devido às desigualdades que podem ser derivadas de seus momentos.
fonte
Um corolário das observações de Glen_b é que o primeiro momento, a média, corresponde ao centro de gravidade de um objeto físico, e o segundo momento em torno da média, a variação, corresponde ao seu momento de inércia. Depois disso, você estará por sua conta.
fonte
Uma árvore binomial tem dois ramos, cada um provavelmente com 0,5. Na verdade, p = 0,5 eq = 1-0,5 = 0,5. Isso gera uma distribuição normal com uma massa de probabilidade distribuída uniformemente.
Na verdade, temos que assumir que cada camada da árvore está completa. Quando dividimos os dados em compartimentos, obtemos um número real da divisão, mas arredondamos. Bem, essa é uma camada incompleta, por isso não terminamos com um histograma aproximando-se do normal.
Altere as probabilidades de ramificação para p = 0,9999 eq = 0,0001 e isso nos leva a um normal distorcido. A massa de probabilidade mudou. Isso explica a assimetria.
Ter camadas ou posições incompletas menores que 2 ^ n gera árvores binomiais com áreas que não têm massa de probabilidade. Isso nos dá curtose.
Resposta ao comentário:
Quando eu estava falando sobre determinar o número de posições, arredondar para o próximo número inteiro.
Máquinas Quincunx soltam bolas que chegam a aproximar-se da distribuição normal via binomial. Várias suposições são feitas por essa máquina: 1) o número de posições é finito, 2) a árvore subjacente é binária e 3) as probabilidades são fixas. A máquina Quincunx no Museu de Matemática de Nova York permite que o usuário altere dinamicamente as probabilidades. As probabilidades podem mudar a qualquer momento, mesmo antes do término da camada atual. Portanto, essa idéia sobre as caixas não serem preenchidas.
Diferentemente do que eu disse na minha resposta original quando você tem um vazio na árvore, a distribuição demonstra curtose.
Estou olhando para isso da perspectiva de sistemas generativos. Eu uso um triângulo para resumir as árvores de decisão. Quando uma nova decisão é tomada, mais caixas são adicionadas na base do triângulo e, em termos de distribuição, nas caudas. Aparar subárvores da árvore deixaria vazios na massa de probabilidade da distribuição.
Eu apenas respondi para lhe dar um senso intuitivo. Etiquetas? Eu usei o Excel e brinquei com as probabilidades no binômio e gerou os desvios esperados. Eu não fiz isso com a curtose, não ajuda que somos forçados a pensar na massa de probabilidade como sendo estática enquanto usamos a linguagem que sugere movimento. Os dados ou bolas subjacentes causam a curtose. Em seguida, analisamos-o de várias formas e atribuímo-lo à forma de termos descritivos como centro, ombro e cauda. As únicas coisas com as quais temos que trabalhar são as caixas. Os compartimentos vivem vidas dinâmicas, mesmo que os dados não possam.
fonte