Que proporção de distribuições independentes fornece uma distribuição normal?

12

A proporção de duas distribuições normais independentes fornece uma distribuição de Cauchy. A distribuição t é uma distribuição normal dividida por uma distribuição qui-quadrado independente. A proporção de duas distribuições qui-quadrado independentes fornece uma distribuição F.

Estou procurando uma razão de distribuições contínuas independentes que forneçam uma variável aleatória normalmente distribuída com média μe variância σ2 ?

Provavelmente existe um conjunto infinito de respostas possíveis. Você pode me dar algumas dessas respostas possíveis? Eu apreciaria particularmente se as duas distribuições independentes cuja razão é calculada são iguais ou pelo menos têm variações semelhantes.

Remi.b
fonte
2
Embora o artigo da Wikipedia sobre distribuições de proporção não forneça exemplos do caso para o qual você procura, é uma leitura interessante.
Avraham
2
Um caso bastante especial é um normal padrão e Y independentemente ± 1, cada um com probabilidade 1XY±1 , depoisX,YeX12XY tem a mesma média e variância eXXY é normalmente distribuído. XY
Henry
1
" A proporção de duas distribuição qui-quadrado independente fornece uma distribuição F " --- bem, não exatamente. Dá uma distribuição beta-prime. Para obter um F, você precisa escalar cada qui-quadrado pelo seu df.
Glen_b -Reinstala Monica 30/10
2
Várias coisas não me convencem de que é necessariamente possível cumprir todas as suas condições.
Glen_b -Reinstala Monica 30/10
1
Tomando o método de geração de variáveis ​​normais (por exemplo, Box-Muller) como exemplo (que usa o método circular), eu diria que não há proporções de distribuições uniformes que fornecem uma distribuição normal (assumindo que distribuições uniformes sejam solicitadas)
Nikos M.

Respostas:

5

Seja ondeEtem uma distribuição exponencial com média2σ2eZ=±1com igual probabilidade. SejaY2=1/Y1=ZEE2σ2Z=±1 ondeBBeta(0,5,0,5). Supondo que(Z,E,B)sejam mutuamente independentes, entãoY1é independente deY2eY1/Y2Normal(0,σ2). Por isso, temosY2=1/BBBeta(0.5,0.5)(Z,E,B)Y1Y2Y1/Y2Normal(0,σ2)

  1. independente de Y 2 ;Y1Y2
  2. Ambos contínuos; de tal modo que
  3. .Y1/Y2Normal(0,σ2)

Eu não descobri como obter um . É mais difícil ver como fazer isso, uma vez que o problema se reduz a encontrar A e B que são independentes, de modo que A - B μNormal(μ,σ2)AB que é um pouco mais difícil do que tornarA/BNormal(0,1)paraAeBindependentes.

ABμBNormal(0,1)
A/BNormal(0,1)AB
cara
fonte
1
Se isso for verdade, isso é incrível.
Neil G
2
@NeilG é verdade; o produto da minha versão beta e exponencial é uma gama com formato 1/2 (por causa de como você pode criar a versão beta e uma gama independente usando gama). Então a raiz quadrada disso é meio normal, usando o fato de que o quadrado de um normal é qui-quadrado.
cara
1
Recentemente, tivemos uma pergunta solicitando um produto de duas variáveis ​​com distribuição normal (não consigo encontrá-lo novamente). Essa pergunta teve um comentário ou resposta relacionada à transformação Box-Muller que calcula uma distribuição normal (ou mais precisamente uma distribuição normal bivariada) a partir do produto de duas variáveis ​​distribuídas uniformes transformadas. Essa resposta está muito relacionada a isso, mas leva o inverso de uma dessas variáveis ​​na transformação Box-Muller. cc: @kjetilbhalvorsen
Sextus
1

Eu apreciaria particularmente se as duas distribuições independentes cuja relação é calculada são as mesmas 

Não possibilidade de que uma variável normal possa ser escrita como uma razão de duas variáveis ​​independentes com o mesmo família de distribuição ou distribuição (como a distribuição F, que é a razão de duas variáveis ​​distribuídas χ2 escala ou a distribuição Cauchy, que é a relação de duas variáveis ​​distribuídas normais com média zero).

  • Suponha que: para qualquer A,BF onde F é a mesma distribuição ou família de distribuição, temos

    X=ABN(μ,σ2)

  • Também devemos ser capazes de reverter A e B (se uma variável normal puder ser escrita como uma razão de duas variáveis ​​independentes com a mesma distribuição ou família de distribuição, a ordem poderá ser revertida)

    1X=BAN(μ,σ2)

  • Mas se XN(μ,σ2) então X1N(μ,σ2) não pode ser verdadeiro (o inverso de uma variável distribuída normal não é outra variável distribuída normal).

Conclusão mais amplo: Se as variáveis em qualquer família distribuição FX pode ser escrito como uma proporção de variáveis em uma outra família de distribuição FY , então deve ser de que a família FX . É fechada sob tomando o inverso (isto é, para qualquer variável cuja distribuição é em FX a distribuição de sua recíproca também estará em FX ).

Por exemplo, o inverso de uma variável distribuída Cauchy também é distribuído Cauchy. O inverso de uma variável distribuída por F também é distribuído por F.

  • Este 'se' não é um 'iff', o inverso não é verdadeiro. Quando X e 1/X estão na mesma família de distribuição, nem sempre é possível escrever como uma distribuição de proporção com nominador e denominador da mesma família de distribuição.

    Counterexample: We can imagine distribution families for which for any X in the family we have 1/X in the same family but we do not have P(X=1)=0. This is contradicting with the fact that for a ratio distribution where the denominator and nominator have the same distribution we must have P(X=1)0 (and something similar can be expressed for continuous distributions like the integral along the line X/Y=1 in a scatterplot of X,Y has some non zero density when X and Y have the same distribution and are independent).

Sextus Empiricus
fonte
Don't see it. Seems to me that just because A/D and B/C are normal that does not make A/DB/C normal.
Carl
Better. Now it makes sense.
Carl
1
I don't understand how the second statement follows from the first. If there exists some A,B such that their quotient is normal, why does it follow that their quotient in the other order should also be normal? The question didn't ask for a distribution family such that the quotient of all pairs of elements is normal.
Neil G
1
I don't understand what you're saying. Ideally, your answer would be a coherent argument without requiring someone to read the edits. Right now, it seems like your second statement ("we must also have") doesn't follow from the first.
Neil G
1
@kjetilbhalvorsen how does it need to be revised? I have answered the part of the question that specifies "I would particularly appreciate if the two independent distributions which ratio is computed are the same". I do not see how the answer by guy relates to it.
Sextus Empiricus
0

Well, here is one but I will not prove it, only show it in simulation.

Make two beta distributions with equal large shape parameters Beta(200,200) (here, n=40,000), subtract 1/2 from the x-values of one of them and call it "numerator." That gives us a PDF that has a maximum range of (12,12), but because the shape parameters are so large, we never get to the maximum values of the range. Here is a histogram of an n=40,000 "numerator" enter image description here

Next, we call the second beta distribution "denominator" without subtracting anything, so it has the usual beta distribution range of (0,1) and one of those looks like this

enter image description here

Again, because the shapes are so large, we do not approach the maximum range with the values. Next we plot the quotient numeratordenominator as a PDF with the superimposed normal distribution.

enter image description here

Now in this case the normal distribution result has μ0.0000204825,σ0.0501789 and tests for normality that look like this

(StatisticP-ValueAnderson-Darling0.7997860.481181Baringhaus-Henze1.405850.0852017Cramér-von Mises0.1231450.482844Jarque-Bera ALM4.481030.106404Kolmogorov-Smirnov0.004523280.386335Kuiper0.007980630.109127Mardia Combined4.481030.106404Mardia Kurtosis1.538490.123929Mardia Skewness2.093990.147879Pearson χ2134.3530.571925Watson U20.1138310.211187)

In other words, we cannot prove the ratio is not normal even trying very hard to do so.

Now why? Intuition on my part, which I have in overabundance. Proof left to reader, if any exists (maybe via limit of method of moments, but again that is just intuition).

Hint: If I use only Beta(20,20) in denominator and Beta(20,20)12 in the numerator and I get Student's t with μ0.000251208,σ0.157665,df33.0402

enter image description here

StatisticP-ValueAnderson-Darling0.2752620.955502Cramér-von Mises0.03511080.956524Kolmogorov-Smirnov0.003209360.804486Kuiper0.005565010.657146Pearson χ2145.0770.323168Watson U20.03510420.878202

Another hint N(0,1)N(10,1/1000) Student's t μ0.0000535722,σ0.0992765,df244.154

enter image description here

(StatisticP-ValueAnderson-Darling0.5016770.745102Cramér-von Mises0.06968240.753515Kolmogorov-Smirnov0.003556880.692225Kuiper0.006083820.501133Pearson χ2142.880.370552Watson U20.06032070.590369)
Carl
fonte
5
You are clearly very close to a normal distribution. However, that isn't at all the same thing as having a normal distribution, and I don't believe the ratio of a centered symmetric beta to an ordinary symmetric beta with the same parameters is ever to be actually normal. I'd be very interested in being wrong about this though.
Glen_b -Reinstate Monica
2
Your solution definitely is not Normal. You could generalize this approach: take any distribution that is approximately Normal and divide it by a distribution with its probability concentrated near a nonzero number. The result (obviously) will be close to Normal--but it still will not be Normal. Applying a bunch of tests is unconvincing because all it shows it that you didn't generate sufficiently large samples to demonstrate the non-Normality.
whuber
1
@whuber At 108 one could also show in normal machine precision that noise will cause anything to be not normal. I do not have a super computer to do that in extended precision. What you could show, and why I wanted you to look at this, was to prove or disprove these things mathematically, not just criticize around the edges with unachievable goals.
Carl
2
Let me get to the heart of the matter, then: (1) disproving normality is a simple exercise in integral approximation--no need to give the details here. You can, e.g., readily prove the 200th moment is infinite. (2) Your answer confuses distributions with samples. It is this fundamental confusion that I object to; it's the reason why I think this answer is more misleading than helpful. BTW, I did not write my last comment lightly: I performed that test. I did it not with a supercomputer, but with a decade-old PC workstation, and the whole process took just seconds.
whuber
1
@whuber Which approximation are you testing? The first, the second or the third? BTW, if they are only approximations, so be it. I suggest only that in the limiting case that they might be exact. All of statistics is an approximation so I do not share your apprehension.
Carl
-3

I imagine there are many possibilities. Here there is one that I can think of. It is known (Zolotarev) that, given X1G,X2G two standard normal distributed r.v., and XγC a Cauchy distributed r.v.

X1GX2G=XγC

Then, by Duality of the Stable distribution, we know that XγC1/X1/γC (where γ is the scale parameter of the Cauchy). So you get that the Normal distribution can be a result from a ratio between a Normal and a Cauchy:

X1G=X2G/X1/γC

for the desired μ I would just move both distributions to be centred there. (at μ). For the σ, in the mentioned wikipedia page about ratio distributions, there are the general formulas for the ratio of two normal distributions, you would just need to replace the scale factor of the Cauchy by its inverse value (γ1/γ).

chuse
fonte
4
Please test your hypothesis, either by explicit calculation of the ratio or via simulation. Either will show that your claim is incorrect. The error lies in assuming that distribution ratios can be "canceled" to "solve for" the numerator.
whuber
1
hm, it is true that the passage of the X2G to the right is shady. I'll check.
chuse