Seja um vetor aleatório. São considerados os momentos de ?

9

Estou aprendendo sobre a teoria dos modelos lineares agora, e uma coisa que acho surpreendente é que, embora esteja definido para um vetor aleatório , não há menção de outros momentos além da matriz de covariância.E[Y]Y=[y1y2yn]

A pesquisa no Google não apareceu muito. São considerados os momentos (brutos) de ou há uma idéia diferente que eu não conheça?kY

Estou aprendendo com o texto Respostas planas a perguntas complexas (o sumário começa na p. 17 do arquivo vinculado). Por "considerado," o que eu quero dizer é se há uma coisa como , e em caso afirmativo, como é que tal conceito ser definido? O livro que tenho apenas cobre o primeiro momento bruto e acho um pouco estranho que não haja menção de como definir dada a minha experiência em probabilidade, nem tenho o conhecimento necessário para defini-la.E[Yk]E[Yk]

Além disso, se E[Yk] não estiver definido, talvez exista um conceito relacionado que eu não conheça que seja usado em seu lugar?

Clarinetist
fonte
Esta página mostra a relação entre momentos brutos e centrais e descreve a vantagem dos momentos centrais.
EdM
@ EdM eu não entendo; parece que está falando de momentos univariados, com os quais estou extremamente familiarizado. Gostaria de saber se existe alguma consideração de -ésimos momentos brutos ( ) para o caso multivariado (ou seja, com vetores aleatórios), não o caso univariado e, se sim, como esse conceito seria definido. kk2
Clarinetist
Relacionados: mathoverflow.net/questions/202732/...
Andrew M
Meu senso é que a estatística invariável em relação à tradução ao longo do eixo de uma variável é considerada a mais útil e, portanto, os momentos brutos não seriam examinados com tanta frequência como os momentos centrais, que possuem essa propriedade útil. Esta página de Validação Cruzada inclui extensa discussão sobre momentos de ordem superior e questões relacionadas.
EdM
Você poderia ampliar o que quer dizer com "teoria do modelo linear" e "considerado"? Em algumas aplicações mais simples de modelos lineares, são feitas suposições apenas sobre os dois primeiros momentos de , mas em outros - como modelos lineares generalizados - são feitas suposições que têm implicações específicas para toda a distribuição de . YY
whuber

Respostas:

8

O análogo apropriado de momentos univariados em um cenário multivariado é visualizar também o expoente como um vetor. A notação exponencial com bases vetoriais e expoentes vetoriais é uma abreviação para o produto,k=(k1,k2,,kn)

yk=y1k1y2k2ynkn.

Para qualquer um destes vectores , o (bruto) k th momento da variável aleatória Y é definido como sendokkºY

μk=E(Yk).

Para motivar essa definição, considere um momento univariado de uma função linear de :Y

E((λ1Y1++λnYn)m)=k(mk)λkμk

onde a soma ocorre sobre todos os cujos componentes são números inteiros não negativos, somando m e ( mkmSão os coeficientes multinominais. A aparência dos momentos multivariados no lado direito mostra por que são generalizações naturais e importantes dos momentos univariados.(mk)=m!/(k1!k2!kn!)

Eles aparecem o tempo todo. Por exemplo, a covariância entre e Y j não é outra senãoYEuYj

Cov(YEu,Yj)=E(YEuYj)-E(YEu)E(Yj)=μkEu+kj-μkEuμkj

onde e k j são os vetores indicadores com zeros em apenas um lugar e um no local indicado. (A mesma fórmula produz elegantemente a variação de Y i quando i = j .)kEukjYEuEu=j

Existem generalizações naturais de todos os conceitos de momento univariado para o cenário multivariado: uma função geradora de momento, cumulantes, uma função geradora de cumulante, momentos centrais, uma função característica e relações algébricas e analíticas entre todos eles.

Referência

Alan Stuart e J. Keith Ord, Teoria Avançada de Estatística de Kendall , Quinta Edição. Oxford University Press, 1987: Volume I, Capítulo 3, Momentos e Cumulantes.

whuber
fonte
3

Além dos pontos do @ whuber

1) Não sei ao certo o que implica a teoria do modelo linear, mas lembre-se de que, nos modelos lineares, geralmente lidamos com variáveis ​​aleatórias normais que têm 0 inclinação e 0 curtose.

2) De maneira mais geral, a pergunta é da forma "Quão preciso é preciso?". Se eu quiser descrever amostras de IID, posso dizer que só quero a média. Como alternativa, eu poderia dizer que quero a média e os erros nos meios. Uma alternativa ainda mais detalhada seria meios, erros nos meios e erros nos erros nos meios. A partir desse padrão, você pode ver como os momentos mais altos continuam se montando. Não existe uma solução real para esse problema, de modo que as pessoas geralmente param no nível 2 (ou seja, média e variância). Isso não quer dizer que os momentos superiores sejam inúteis. De fato, para problemas envolvendo distribuições de cauda gorda, esses problemas se tornam relevantes

Sid
fonte