Como a notação lida?

10

Como a notação lida? É segue uma distribuição normal? Ou é uma distribuição normal? Ou talvez seja aproximadamente normal ..X X XXN(μ,σ2)X X X

E se houver várias variáveis ​​que seguem (ou sejam quais forem as palavras) a mesma distribuição? Como está escrito?

não
fonte
XN(μ,σ) deve ser XN(μ,σ2)
mandata
7
@mandata que (infelizmente) depende de quem você pergunta. Muitos autores usam σ na definição e na notação.
Ekvall
Eu mesmo prefiro o σ , mas isso vai contra a corrente.
mandata
3
A notação comum é que " " significa distribuído como, " ˙ " (observe o ponto) significa aproximadamente distribuído como.
Cliff AB
É (X,Y)N(μ,σ2) a notação correta em relação ao segundo ponto?
não

Respostas:

7

Eu acho que a variável X é distribuída de acordo com a distribuição Normal com vetor médio μ e desvio padrão σ .

Vladislavs Dovgalecs
fonte
Por que vector ? μ
não
Porque a distribuição normal pode ser multivariada. Pode ser um valor único, também pode ser generalizado para dimensões. n
Vladislavs Dovgalecs
3
Por que o apenas um escalar? σ
não
Você está certo, o não é escalar em geral para casos multivariados. Você está falando então sobre a matriz de covariânciaΣσΣ
Vladislavs Dovgalecs
desvio padrão .
conjugateprior
9

Quanto ao uso dos símbolos ("segue", "é distribuído de acordo com") e ("é igual a aproximadamente"), consulte esta resposta . É assim que os símbolos são usados ​​pelo menos em Estatística / Econometria.

No que diz respeito às convenções notacionais para uma distribuição, o normal é um caso limítrofe : normalmente escrevemos os parâmetros definidores de uma distribuição ao lado de seu símbolo, os parâmetros que permitirão escrever corretamente sua função de distribuição Cumulativa e sua função de densidade / massa de probabilidade. Não anotamos os momentos, que geralmente são função, mas não são iguais, desses parâmetros.

Assim, para um uniforme que varia em , escrevemos . A média da distribuição é enquanto a variação é . Para uma gama (parametrização em escala de forma), escrevemos . A média é e a variância . Etc.L ( um , b ) ( a + b ) / 2 ( b - a ) 2 / 12 G ( k , θ ) k θ k θ dois[a,b]U(a,b)(a+b)/2(ba)2/12G(k,θ)kθkθ2

No caso da distribuição normal, o parâmetro também é a média da distribuição, enquanto o parâmetro é a raiz quadrada da variância. Tenho a impressão (possivelmente equivocada) de que nos círculos de engenharia se vê com mais frequência (que está de acordo com a regra geral da notação), enquanto nos círculos econométricos quase sempre se vê (que cai na tentação de fornecer os momentos, tratando como o parâmetro base e não como o quadrado dele).σ N ( μ , σ ) N ( μ , σ 2 ) σ 2μσN(μ,σ)N(μ,σ2)σ2

Alecos Papadopoulos
fonte
6

EDIT: Minha resposta anterior falhou ao responder à pergunta real. O que se segue é minha tentativa de uma resposta mais direta.


Como a notação lida?XN(μ,σ2)

Outras respostas já dizem o que significa a notação, ou seja, que é uma variável aleatória distribuída normalmente com alguma média e variância . A resposta de Dilip também fornece uma boa explicação de outras interpretações possíveis quando a notação é menos clara que , por exemplo, para parâmetros gerais , viz. .μ σ 2 σ 2 { a , b } X N ( a , b )Xμσ2σ2{a,b}XN(a,b)

Sempre que vejo essa notação no texto, costumo lê-la para que faça sentido gramaticalmente. Eu diria que essa é a maneira sensata de tratar a notação. Assim, a resposta para sua pergunta é que, sabendo o que a notação significa matematicamente, você simplesmente a lê de qualquer maneira que se encaixe no texto. Aqui estão dois exemplos:

(1) Seja ...XN(a,b)

(2) Considere três variáveis ​​aleatórias independentes,XN(0,1),YN(1,2),ZExp(λ).

Em (1) eu li como (por exemplo) "Seja normalmente distribuído com média ae variância b ...", e em (2) eu li como "... é padrão normal ...".XXX

É X segue uma distribuição normal?

Sim, isso também funciona. Muitas pessoas dizem isso dessa maneira, embora você queira incluir a média e a variação que caracterizam a distribuição.

Ou X é uma distribuição normal?

Não, isso está incorreto. Veja esta minha antiga resposta para uma descrição do que é uma distribuição.

Ou talvez X seja aproximadamente normal ..

Não, isso também está incorreto. Existem outras maneiras de denotar isso. Como apontado nos comentários, é um deles.

E se houver várias variáveis ​​que seguem (ou sejam quais forem as palavras) a mesma distribuição? Como está escrito?

Se todos forem independentes, uma maneira fácil de escrever isso é , considerando que você tem variáveis (iid significa independente e identicamente distribuído). Se eles não forem independentes, você pode dizer que são possivelmente dependentes, mas (marginalmente) distribuídos identicamente como . Ou talvez você precise declarar a distribuição conjunta deles - isso depende de qual propósito você tem para considerar as variáveis ​​aleatórias.n X i , i = 1 , 2 , , n N ( μ , σ 2 )XiiidN(μ,σ2),i=1,2,nnXi,i=1,2,,nN(μ,σ2)

Se eles são conjuntamente normais, é fácil escrever que para caracterizar completamente sua distribuição conjunta usando algum vetor médio e matriz de covariância .μ ΣX:=(X1,,Xn)N(μ,Σ)μΣ

Em geral, você pode definir qualquer função de distribuição multivariada e, em seguida, escrever que .XFFXF

ekvall
fonte
Não é legal que, independentemente da convenção usada, seja sempre a variável aleatória normal normal? N(0,1)
precisa
@DilipSarwate, de fato! Torna o nome "padrão" muito adequado também.
Ekvall
5

A dificuldade não está em saber o que significa. Mesmo é razoavelmente inequívoco para a maioria das pessoas, pois significa uma variável aleatória normal com média e variação ou variação (os puristas devem acreditar que o desvio padrão é um parâmetro mais fundamental do que a variação deve dizer "desvio padrão "). No entanto, o que se entende por , por exemplo, está sujeito a pelo menos três convenções diferentes em relação à variação ou desvio padrão. Todas as três convenções concordam que é a médiaN ( 3 , 5 2 ) 3 5 2 25 5 N ( a , b ) N ( 3 , 25 ) 3 μ X X 2 5N(μ,σ2)N(3,52)352255N(a,b)N(3,25)3 μX de mas o tem significados diferentes para pessoas diferentes.X25

  • X 25XN(,25) significa que o desvio padrão de é . X25

  • X 25XN(,25) significa que a variação de é .X25

  • X 1XN(,25) significa que a variação de é .X125

Veja esta pergunta e os comentários a seguir para alguns detalhes.

Dilip Sarwate
fonte
quem além de você já teve a interpretação de que o 2º parâmetro de um Normal é o inverso da variância? É a primeira vez que me lembro de ter visto uma coisa dessas.
18715 Mark-Stone Stone
@ MarkL.Stone Por favor, não lide com a minha veracidade. Se você se desse ao trabalho de seguir o link que incluí na minha resposta e de ler os comentários, veria que o moderador whuber disse "Outros, especialmente em um contexto bayesiano, parametrizam até os normais por sua precisão, como em . " e o cardeal Moderador disse que "também existem parâmetros naturais do normal , que provavelmente parecem pouco naturais para a maioria". Esses "parâmetros naturais" surgem quando a distribuição normal é definida como um membro da família exponencial de distribuições. N(μ,1/σ2)
precisa
Eu não estava tentando difamar sua veracidade. Olhei para o tópico e vi sua resposta, mas perdi o comentário do whuber. Acho que não sou bayesiano.
18715 Mark-Stone Stone
4

XX é uma variável aleatória " ";X

é lido "é distribuído como";

N é lido como "Normal";

μμ é lido "com média " (a convenção é que a primeira entrada após o parêntese aberto é a média e a segunda é a variação ou desvio padrão, dependendo da notação - veja abaixo); eμ

σ 2 σ 2 σ 2σ2 é lido "com variação (ou desvio padrão , dependendo do uso do autor / usuário. Nesse caso, acho que é com variação .σ2σ2σ2

Juntando tudo isso, você tem uma variável aleatória que é distribuída como Normal com uma média "mu" ( ) e uma variação "sigma ao quadrado" ( ).μ σ 2Xμσ2

Você também pode dizer que segue um normal. . .X

Se várias variáveis ​​seguirem a mesma distribuição, você poderá representar isso de várias maneiras, mas convém indexar as variáveis ​​de para . Então você pode escrever, , para a .n X iN ( μ , σ 2 ) i = 1 ni=1nXiN(μ,σ2)i=1n

Estatísticas
fonte
0

μ σX é normalmente distribuído com média e desvio padrão . O til não significa aproximação, pois não está relacionado a um sinal de igual, embora o implique de uma maneira, pois X nunca é definitivamente conhecido.μσ

mandata
fonte
Por que não? Existem populações que são totalmente conhecidas.
não
X representa uma variável, não um conjunto de valores.
mandata
2
X é de fato uma variável aleatória ex pode ser um de seus valores. Mas isso significa que não há aproximação: tudo o que há para saber (definitivamente) sobre X é declarado na expressão que estamos discutindo.
conjugateprior
2
Para o registro, é um til. Tilda é uma marca de arroz basmati :-)
conjugateprior