Se

9

Suponha a seguinte configuração:
Seja . Também . Além disso, ie é uma combinação convexa dos limites dos respectivos suportes. é comum para todos .Zi=min{ki,Xi},i=1,...,nXiU[ai,bi],ai,bi>0ki=cai+(1c)bi,0<c<1kici

Eu acho que tenho a distribuição de correta: é uma distribuição mista . Possui uma parte contínua, e, em seguida, uma descontinuidade e uma parte discreta em que massa concentrada de probabilidade:X i[ a i , k i ) , Z i = X iPr ( Z iz i ) = z i - a iZi

Xi[ai,ki),Zi=XiPr(Zizi)=ziaibiai

Pr(Zi=ki)=Pr(Xi>ki)=1Pr(Xiki)
=1kiaibiai=1(1c)(biai)biai=c

Assim, em todos os

FZi(zi)={0zi<aiziaibiaiaizi<ki1kizi

enquanto para a função de massa / densidade "discreta / contínua" mista, é fora do intervalo , possui uma parte contínua que é a densidade de um uniforme , mas para , e concentra a massa de probabilidade positiva em .0[ai,ki]U(ai,bi) aizi<kic>0zi=ki1biaiaizi<kic>0zi=ki

Ao todo, isso resume a unidade sobre os reais.

Eu gostaria de poder derivar ou dizer algo sobre a distribuição e / ou momentos da variável aleatória , como . n Sni=1nZin

Digamos, se os são independentes, parece como . Posso "ignorar" essa parte, mesmo como uma aproximação? Então eu ficaria com uma variável aleatória que varia no intervalo , parecendo a soma de uniformes censurados, a caminho de se tornar "não censurado" e, portanto, talvez algum teorema central do limite ... mas provavelmente estou divergindo em vez de convergir aqui, então, alguma sugestão? Pr ( S n = Σ n i k i ) = c n0 n [ Σ n i = 1 um i ,XiPr(Sn=inki)=cn0n[i=1nai,i=1nki)

PS: Esta questão é relevante, Derivando a distribuição da soma das variáveis ​​censuradas , mas a resposta de @Glen_b não é o que eu preciso - eu tenho que trabalhar isso analiticamente, mesmo usando aproximações. Esta é uma pesquisa, portanto, trate-a como lição de casa - sugestões gerais ou referências à literatura são boas o suficiente.

Alecos Papadopoulos
fonte
Se você precisar disso, escreva a distribuição de como , com um adequado , em que é um conjunto de Borel. ZiμZi(B)=P(ZiB)=Bg(t)dt+cIB(ki)gB
Zen
@ Zen já escrevi na pergunta que a distribuição é descontínua. Além disso, o RHS de torna óbvio que esse representa uma densidade em , mas uma probabilidade para - e eu prefiro uma notação compacta. ff[ai,ki)ki
Alecos Papadopoulos
Até onde eu sei, essa notação com foi um pdf e um pmf não existe; e temos a linguagem matemática adequada para descrever com precisão as distribuições mistas. Duvido que essa notação seja aceita quando você publicar sua pesquisa. Apenas minha opinião, claro. Você sempre deve fazer do jeito que você gosta. f
Zen
O @Zen Publishing está muito longe à frente - e, de fato, os revisores franzem a testa quando veem notação não estabelecida. Este é apenas um atalho quando se deseja descrever uma distribuição gradual em várias linhas. Não há "argumento a favor" e contra a notação estabelecida, como por exemplo a que você usou em um comentário anterior.
Alecos Papadopoulos

Respostas:

5

δ=1aibiai=0bi=1ki=2/3i1

xbar <- replicate(10^4, mean(pmin(runif(10^4), 2/3)))
hist((xbar - mean(xbar)) / sd(xbar), breaks = "FD", freq = FALSE)
curve(dnorm, col = "blue", lwd = 2, add = TRUE)

CLT

zen
fonte
Realmente bastante normal. Bom saber. As condições usuais para o CLT nunca foram um problema aqui, minha pergunta era se havia outros problemas, talvez sutis, que distorceram o resultado assintótico e exigiram um CLT modificado. Sua simulação mostra que, de fato, a descontinuidade discreta se torna insignificante em probabilidade, à medida que mais variáveis ​​entram na soma.
Alecos Papadopoulos
ii
Agradável. Boa sorte com os próximos passos. Parece um problema interessante.
Zen
3

Dicas:

cXiμiσi2Ziμi=E[Zi]=cai+ki2+(1c)kiki=cai+(1c)bi .

aibi11nσi2(1nZi1nμi)1nZi1nμi1nσi2

Henry
fonte
aibi
aibi
2

Minha principal preocupação nesta pergunta era se alguém poderia aplicar o CLT "como de costume" no caso que estou examinando. O usuário @Henry afirmou que é possível, o usuário @Zen mostrou através de uma simulação. Assim encorajado, agora vou provar analiticamente.

μiZiσiZiZ~i=Ziμiσi

fZ~(z~i)=σifZ(zi)=σibiai
Z~i
M~i(t)=E(ez~it)=ez~itdFZ~(z~i)=a~ik~iσiez~itbiaidzi+cek~it

M~i(t)=σibiaiek~itea~itt+cek~it
k~i=kiμiσi,a~i=aiμiσi

M~i(0)=1,M~i(0)=E(Z~)=0M~i(0)=E(Z~i2)=Var(Z~i)=1

Portanto, temos um MGF adequado. Se considerarmos a expansão de Taylor de segunda ordem em torno de zero, teremos

M~(t)=M~(0)+M~(0)t+12M~(0)t2+o(t2)

M~(t)=1+12t2+o(t2)

Isso implica que a função característica é (aqui denota a unidade imaginária) .i

ϕ~(t)=1+12(it)2+o(t2)=112t2+o(t2)

Pelas propriedades da função característica , temos que a função característica de é igual aZ~/n

ϕ~Z~/n(t)=ϕ~Z~(t/n)=1t22n+o(t2/n)

e como temos variáveis ​​aleatórias independentes, a função característica de é1ninZ~i

ϕ~1ninZ~i(t)=i=1nϕ~Z~(t/n)=i=1n(1t22n+o(t2/n))

Então

limnϕ~1ninZ~i(t)=limn(1t22n)n=et2/2

pela forma como o número é representadoe . Acontece que o último termo é a função característica da distribuição normal padrão e, pelo teorema da continuidade de Levy , temos que

1ninZ~idN(0,1)

qual é o CLT. Observe que o fato de as variáveis - não serem distribuídas de maneira idêntica "desapareceu" de vista quando consideramos suas versões centralizadas e escalonadas e consideramos a expansão de Taylor de segunda ordem de seus MGF / CHF: nesse nível de aproximação, essas funções são idênticas e todas as diferenças são compactadas nos termos restantes que desaparecem assintoticamente. Z

O fato de que o comportamento idiossincrático no nível individual, de todos os elementos individuais, desaparece quando consideramos o comportamento médio, acredito que seja muito bem exibido usando uma criatura desagradável como uma variável aleatória com distribuição mista.

Alecos Papadopoulos
fonte
Muito legal, Alecos. Meu sentimento é que o argumento deve depender de condições mais específicas dos 's e ' s. Por exemplo: a prova é interrompida se rapidamente? (Eu sei que no seu aplicativo isso não acontece.) O que você acha? b i ( b i - a i ) 0aibi(biai)0
Zen
@Zen A questão das variações de RVs independentes, mas não identicamente distribuídos, é muito sutil, acho que ainda não a entendo claramente. As condições conhecidas de Lyapunov ou Lindeberg são suficientes apenas para o CLT se manter. Há casos em que o CLT é válido, embora essas condições não o sejam. Portanto, acho que se não limitarmos as variações, não haverá uma resposta única e o problema se tornará totalmente específico para cada caso. Mesmo o livro de Billingsley não é claro sobre o assunto. A questão é como será o restante e o que podemos dizer sobre isso.
Alecos Papadopoulos