Por que a distribuição Cauchy não tem significado?

109

A partir da função densidade de distribuição, podemos identificar uma média (= 0) para a distribuição Cauchy, como mostra o gráfico abaixo. Mas por que dizemos que a distribuição Cauchy não tem significado?

insira a descrição da imagem aqui

Porco voador
fonte
2
Eu recomendo a referência Cabeza G., UA. (2013). A Mídia da Distribuição de Cauchy. No blog Apoyo en Matemáticas, sobre a média da distribuição de Cauchy.
Veja minha resposta aqui: stats.stackexchange.com/questions/94402/…
kjetil b halvorsen

Respostas:

99

Você pode verificar mecanicamente se o valor esperado não existe, mas isso deve ser fisicamente intuitivo, pelo menos se você aceitar o princípio de Huygens e a Lei dos Grandes Números . A conclusão da Lei dos Grandes Números falha na distribuição de Cauchy, por isso não pode ter um significado. Se você calcular a média de variáveis ​​aleatórias independentes de Cauchy, o resultado não converge para como com probabilidade . Permanece uma distribuição Cauchy do mesmo tamanho. Isso é importante na óptica.0 n 1n0n1

A distribuição de Cauchy é a intensidade normalizada da luz em uma linha de uma fonte pontual. O princípio de Huygens diz que você pode determinar a intensidade assumindo que a luz seja reemitida de qualquer linha entre a fonte e o alvo. Portanto, a intensidade da luz em uma linha a metros de distância pode ser determinada assumindo que a luz atinja uma linha a metro de distância e seja reemitida em qualquer ângulo à frente. A intensidade da luz em uma linha a metros de distância pode ser expressa como a convolução vezes da distribuição de luz em uma linha a metro de distância. Ou seja, a soma de distribuições independentes de Cauchy é uma distribuição de Cauchy escalada por um fator de .1 n n 1 n n21nn1nn

Se a distribuição Cauchy teve uma média, em seguida, os percentil do convolução fold dividido por teria que convergem para pela Lei dos Grandes Números. Em vez disso, permanece constante. Se você marcar o percentil em uma linha (transparente) a metro, metros, etc., esses pontos formarão uma linha reta, a graus. Eles não dobram em direção a .n n 0 25 1 2 45 025nn02512450

Isso informa sobre a distribuição de Cauchy em particular, mas você deve conhecer o teste integral, porque existem outras distribuições sem meios que não têm uma interpretação física clara.

Douglas Zare
fonte
39
+1 Agora existe uma resposta esclarecedora :-) (desculpe). A propósito, o princípio é nomeado para Christiaan Huygens, não Huygen. Huygens foi o primeiro a apreciar novos desenvolvimentos em probabilidade publicados na década de 1650 por Pascal (com base em suas cartas com Fermat): foi o relato de Huygens sobre essas idéias (1657), incluindo o da expectativa, que originalmente obteve a teoria da probabilidade em uma matemática. e abriu o caminho para o tratado seminal (póstumo) de Jakob Bernoulli ( Ars Conjectandi , 1713).
whuber
4
As amplitudes são propagadas, não as intensidades.
Doru Constantin
2
Esta é uma ótima resposta, mas acho o final confuso: "... marque o 25º percentil em ... uma linha reta, a 45 graus. Eles não dobram para zero". A afirmação em si é verdadeira (como conseqüência do princípio de Huygens-Fresnel), mas isso é antes "dividido por ". Ao dividir por 2 a 2 metros, dividido por 3 a 3 metros, ..., a linha transparente é vertical (perpendicular à tela que captura a luz). A linha quantil de 45 graus pertence à soma de Cauchy e não ajuda no argumento (ainda). n
Lee David Chung Lin 31 /
40

Resposta adicionada em resposta ao comentário do @ whuber na resposta de Michael Chernicks (e reescrita completamente para remover o erro apontado pelo whuber.)

Diz-se que o valor da integral para o valor esperado de uma variável aleatória Cauchy é indefinido porque o valor pode ser "feito" para ser o que se quiser. A integral (interpretada no sentido de uma integral de Riemann) é o que é comumente chamado de uma integral imprópria e seu valor deve ser calculado como um valor limite: ou

xπ(1+x2)dx
xπ(1+x2)dx=limT1limT2+T1T2xπ(1+x2)dx
xπ(1+x2)dx=limT2+limT1T1T2xπ(1+x2)dx
e, claro, ambas as avaliações devem fornecer o mesmo valor finito. Caso contrário, a integral é considerada indefinida. Isso mostra imediatamente por que a média da variável aleatória Cauchy é definida como indefinida: o valor limite no limite interno diverge.

O valor principal de Cauchy é obtido como um único limite: vez do limite duplo acima. O valor principal da integral expectativa é facilmente visto como sendo uma vez que o limitand tem valor para todo . Mas isso não pode ser usado para dizer que a média de uma variável aleatória Cauchy é . Ou seja, a média é definida como o valor da integral no sentido usual e não no sentido do valor principal.0 0 T 0

limTTTxπ(1+x2)dx
00T0

Para , considere a integral que se aproxima de um valor limitador de como . Quando , obtemos o valor principal discutido acima. Assim, não podemos atribuir um significado inequívoco à expressãoα T - T xα>0ln(α)

TαTxπ(1+x2)dx=TTxπ(1+x2)dx+TαTxπ(1+x2)dx=0+ln(1+x2)2π|TαT=12πln(1+α2T21+T2)=12πln(α2+T21+T2)
tct=10- xln(α)πTα=10
0
xπ(1+x2)dx
sem especificar como os dois infinitos foram abordados e ignorar esse ponto leva a todos tipos de complicações e resultados incorretos, porque as coisas nem sempre são o que parecem quando o leite de valor principal se disfarça como a nata do valor. É por isso que a média da variável aleatória Cauchy é definida como indefinida, em vez de ter o valor , o valor principal da integral.0

Se alguém estiver usando a abordagem teórica da medida da probabilidade e a integral do valor esperado for definida no sentido de uma integral de Lebesgue, a questão será mais simples. existe apenas quando é finito e, portanto, é indefinido para uma variável aleatória Cauchy uma vez que não é finito.| g | E [ X ] X E [ | X | ]g|g|E[X]XE[|X|]

Dilip Sarwate
fonte
9
A avaliação da integral do meio está incorreta: é zero, não um logaritmo. O problema está na avaliação dos dois limites implícitos nas integrais infinitas.
whuber
@whuber Obrigado por apontar o erro. Reescrevi completamente minha resposta e seu comentário não se aplica mais.
precisa saber é o seguinte
Não entendo por que a expectativa da relação não existe. Se e são normalmente distribuídos em conjunto com média diferente de zero, então a média de é dada por , o que estou perdendo? Y Z = XXYxZ=XYxyp(x,y)dxdy
Royi
@Drazick Eu não mencionei a proporção de duas variáveis ​​aleatórias normais em nenhum lugar da minha resposta. Por favor, pergunte a alguém que levantou esse problema com relação às variáveis ​​aleatórias Cauchy.
precisa saber é o seguinte
2
@Drazick Verifique se sua integral existe . Em geral, se a densidade de é contínua em uma vizinhança de , E [X ^ {- 1}] $ não existe. 0X0
precisa saber é o seguinte
33

Embora as respostas acima sejam explicações válidas de por que a distribuição de Cauchy não tem expectativa, acho que a razão de duas variáveis normais normais é Cauchy igualmente esclarecedora: de fato, have e a segunda expectativa é .X1/X2N(0,1)

E[|X1||X2|]=E[|X1|]×E[1|X2|]
+
Xi'an
fonte
1
Estáuma variável aleatória Cauchy 'dobrada' quando eu sei que é Cauchy padrão? Como encontrar a distribuição de? |X1X2|X1X2|X1X2|
StubbornAtom
1
Sim, esse é o valor absoluto de uma variável de Cauchy, que tem, assim, a densidade sobre os números reais positivos. f(x)+f(x)
Xi'an
Se você dobrar a distribuição normal, entãonão é infinito? E1/|X2|
Albert Chen
É infinito.
Xian
22

O Cauchy não tem média porque o ponto que você seleciona (0) não é médio. É uma mediana e um modo . A média para uma distribuição absolutamente contínua é definida como que é a função de densidade e a integral é assumida pelo domínio de (que é a no caso de Cauchy). Para a densidade de Cauchy, essa integral simplesmente não é finita (a metade de a é e a metade de a é ).f f - - 0 - 0 xf(x)dxff00

Michael Chernick
fonte
9
Não estou criticando você, @Dilip: estou aumentando sua observação. O que é muito interessante é que a existência de um valor principal zero pode nos tentar definir a média da distribuição de Cauchy (ou a média de qualquer VR) como o valor principal da integral. Isso investiga muito mais profundamente a natureza dessa questão, que é encoberta ao declarar que a integral é infinita ou indefinida: a saber, por que o valor principal não funciona ? Por que não seria legítimo usar isso como um meio?
whuber
5
@whuber Também é interessante que, se você truncar a integral em -a e + a para qualquer a> 0, obtém 0. Portanto, considerando o limite como uma aproximação, integral da integral simétrica dá 0. Outro motivo para perguntar por que não é 0 a média.
Michael Chernick 10/09/12
10
@ whuber: Tomo sua última pergunta em sua penúltima observação para ser retórica; de qualquer forma, queremos convergência absoluta e "a" razão em minha mente é que queremos que as coisas se comportem como áreas. Em particular, precisamos ser capazes de dividir as coisas (funções) em pedaços e reorganizá-las à vontade, sem perturbar a resposta que obtemos. Não podemos fazer isso cortando e reorganizando para uma função linear em uma distribuição de Cauchy; portanto, devemos insistir em que sua média não existe.
cardeal
9
Essa, @ cardinal, é uma boa resposta! Eu não estava apenas sendo retórica, porque a pergunta em si pergunta "por que dizemos que [a] distribuição Cauchy não tem significado?" Afirmar que a expectativa é indefinida pode satisfazer o incurável, mas a possibilidade de que exista uma definição alternativa razoável da integral - e produza uma resposta intuitivamente correta! - deve incomodar as pessoas. Sua resposta está próxima do que eu tinha em mente, mas ainda está incompleta. Penso que uma resposta satisfatória identificaria teoremas importantes da teoria estatística que falham quando trabalhamos com integrais condicionalmente convergentes.
whuber
7
@Dilip Eu também pensava assim, mas, pensando bem, acho que isso é um pouco mais desafiador do que você parece sugerir. Por exemplo, não há problema com o Teorema do Limite Central: exigir uma variação garante automaticamente uma expectativa, é claro. E muitos teoremas são comprovados usando a desigualdade de Chebyshev, onde mais uma vez garantimos uma média. Por isso, estou realmente curioso: quais são os grandes teoremas usados ​​na prática da estatística em que realmente temos que estar cientes dos problemas com expectativas condicionalmente convergentes, mas não convergentes?
whuber
16

A distribuição de Cauchy é mais bem pensada como a distribuição uniforme em um círculo unitário; portanto, seria surpreendente se a média fizesse sentido. Suponha que seja algum tipo de "função de média". Ou seja, suponha que, para cada subconjunto finito do círculo unitário, fosse um ponto do círculo unitário. Claramente, tem que ser "não natural". Mais precisamente, não pode ser equivalente em relação às rotações. Para obter a distribuição de Cauchy em sua forma mais usual, mas menos reveladora, projete o círculo unitário no eixo x de (0,1) e use essa projeção para transferir a distribuição uniforme no círculo para o eixo x.X f ( X ) f ffXf(X)ff

Para entender por que a média não existe, pense em x como uma função no círculo unitário. É muito fácil encontrar um número infinito de arcos disjuntos no círculo unitário, de modo que, se um dos arcos tiver comprimento d, x> 1 / 4d nesse arco. Portanto, cada um desses arcos separados contribui com mais de 1/4 da média e a contribuição total desses arcos é infinita. Podemos fazer a mesma coisa novamente, mas com x <-1 / 4d, com uma contribuição total menos o infinito. Esses intervalos podem ser exibidos com um diagrama, mas é possível fazer diagramas para validação cruzada?

David Epstein
fonte
1
Bem-vindo ao site, @DavidEpstein. Você pode criar imagens com o seu software preferido e enviá-las para sua resposta clicando no pequeno ícone de imagem (para iniciar o assistente) acima do campo de resposta. Infelizmente, porém, você precisa de> = 10 representantes para fazer isso. Tenho certeza que você terá isso em breve; nesse ínterim, se você puder postar a imagem em qualquer outro lugar da Internet e postar um link para ela na sua resposta, um usuário com mais representantes poderá buscá-la e publicá-la para você.
gung
3
Eu não sabia que Cauchy era interpretado como um uniforme em um círculo, mas certamente faz sentido. Um argumento topológico mostra que não pode haver função contínua em um círculo que possua as propriedades de uma função de média.
johnny
@DavidEpstein Também li sua resposta no outro post . A projeção estereográfica é muito boa. Em comparação, você pode comentar por que a projeção radial igualmente válida de um semicírculo não implica que a média seja bem definida? Ou seja, , então é o padrão Cauchy. Geometricamente, esse é o fato básico de que um ângulo inscrito é sempre metade do seu ângulo central correspondente. X tan ( π ( U - 1UUnif[0,1]Xtan(π(U12))
Lee David Chung Lin
Na verdade, em termos do modelo físico de uma fonte de luz, a imagem do semicírculo é mais apropriada, pois não está claro imediatamente por que o princípio de Huygens daria uma projeção estereográfica.
David David Chung Lin
10

O valor médio ou esperado de alguma variável aleatória é uma integral de Lebesgue definida sobre alguma medida de probabilidade : P E X = X d PXP

EX=XdP

A inexistência da média da variável aleatória Cauchy significa apenas que a integral de Cauchy rv não existe. Isso ocorre porque as caudas da distribuição de Cauchy são caudas pesadas (compare com as caudas da distribuição normal). No entanto, a inexistência do valor esperado não proíbe a existência de outras funções de uma variável aleatória de Cauchy.

Tomas
fonte
5
As caudas são "pesadas" no sentido de que não decaem com rapidez suficiente em nenhuma direção, para fazer convergir a integral. Este conceito não tem nada a ver com distribuições normais (ou qualquer distribuição de referência).
whuber
4
Sim, obrigado por esta correção. Não pretendi implicar nenhuma conexão rigorosa entre caudas pesadas e distribuição normal. No entanto, acho que comparar a distribuição normal (com caudas leves) e a distribuição de cauda pesada visualmente facilita (nem sempre) um pouco mais fácil de entender o conceito de cauda "pesada".
Tomas
5

Aqui está mais uma explicação visual. (Para aqueles de nós que são desafiados pela matemática.). Pegue um gerador de números aleatórios distribuído com cuidado e tente calcular a média dos valores resultantes. Aqui está uma boa página sobre uma função para isso. https://math.stackexchange.com/questions/484395/how-to-generate-a-cauchy-random-variable Você descobrirá que a "pontada" dos valores aleatórios faz com que ele fique maior à medida que avança, em vez de menor . Portanto, não tem significado.

Paulo
fonte
4

Apenas para acrescentar às excelentes respostas, farei alguns comentários sobre por que a não convergência da integral é relevante para a prática estatística. Como outros mencionaram, se permitirmos que o valor principal seja "médio", o slln não será mais válido! Além disso, pense nas implicações do fato de que, na prática, todos os modelos são aproximações. Especificamente, a distribuição de Cauchy é um modelo para uma variável aleatória ilimitada. Na prática, variáveis ​​aleatórias são limitadas, mas os limites são frequentemente vagos e incertos. Usar modelos ilimitados é uma maneira de aliviar isso, pois torna desnecessária a introdução de limites inseguros (e muitas vezes não naturais) nos modelos. Mas, para que isso faça sentido, aspectos importantes do problema não devem ser afetados. Isso significa que, se introduzirmos limites, isso não deve alterar de maneira importante o modelo. Mas quando a integral não é convergente, isso não acontece! O modelo é instável, no sentido de que a expectativa do RV dependeria dos limites amplamente arbitrários. (Em aplicativos, não há necessariamente nenhum motivo para tornar os limites simétricos!)

Por esse motivo, é melhor dizer que a integral é divergente do que dizer que é "infinita", sendo a última próxima a implicar algum valor definido quando não existe! Uma discussão mais aprofundada está aqui .

kjetil b halvorsen
fonte
-4

Eu queria ser um pouco exigente por um segundo. O gráfico na parte superior está errado. O eixo x está em desvios padrão, algo que não existe para a distribuição de Cauchy. Estou sendo exigente porque uso a distribuição Cauchy todos os dias da minha vida em meu trabalho. Existe um caso prático em que a confusão pode causar um erro empírico. A distribuição t do aluno com 1 grau de liberdade é o padrão Cauchy. Geralmente, ele lista vários sigmas necessários para o significado. Esses sigmas NÃO são desvios padrão, são erros prováveis ​​e mu é o modo.

Se você deseja fazer o gráfico acima corretamente, o eixo x são dados brutos ou se você deseja que eles tenham erros de tamanho equivalente, você deve fornecer a eles erros iguais prováveis. Um erro provável é o desvio padrão de 0,67 na distribuição normal. Nos dois casos, é o intervalo semi-interquartil.

Agora, como resposta à sua pergunta, tudo o que todos escreveram acima está correto e é a razão matemática para isso. No entanto, eu suspeito que você é um estudante e novo no tópico e, portanto, as soluções matemáticas contra-intuitivas para o visualmente óbvio podem não parecer verdadeiras.

Eu tenho duas amostras quase idênticas do mundo real, extraídas de uma distribuição de Cauchy, ambas têm o mesmo modo e o mesmo erro provável. Um tem uma média de 1,27 e um tem uma média de 1,33. Aquele com média de 1,27 tem um desvio padrão de 400, aquele com média de 1,33 tem um desvio padrão de 5,15. O erro provável para ambos é 0,32 e o modo é 1. Isso significa que, para dados simétricos, a média não está nos 50% centrais. É necessária apenas uma observação adicional para empurrar a média e / ou a variação fora da significância para qualquer teste. O motivo é que a média e a variação não são parâmetros e a média da amostra e a variação da amostra são elas próprias números aleatórios.

A resposta mais simples é que os parâmetros da distribuição de Cauchy não incluem uma média e, portanto, nenhuma variação sobre uma média.

É provável que, em sua pedagogia passada, a importância da média tenha sido porque ela geralmente é uma estatística suficiente. Nas estatísticas baseadas em frequência de longo prazo, a distribuição de Cauchy não possui estatística suficiente. É verdade que a mediana da amostra, para uma distribuição de Cauchy com suporte em todo o real, é uma estatística suficiente, mas isso porque a herda de ser uma estatística de ordem. É meio que coincidentemente suficiente, sem uma maneira fácil de pensar sobre isso. Agora, nas estatísticas bayesianas, existe uma estatística suficiente para os parâmetros da distribuição de Cauchy e, se você usar um uniforme anterior, também será imparcial. Trago isso à tona porque, se você precisar usá-los diariamente, você aprenderá sobre todas as formas de realizar estimativas sobre eles.

Não há estatísticas de pedidos válidas que possam ser usadas como estimadores de distribuições truncadas de Cauchy, que são as que você provavelmente encontrará no mundo real e, portanto, não há estatística suficiente nos métodos baseados em frequência para a maioria, mas não todas as aplicações do mundo real .

O que eu sugiro é se afastar do mau, mentalmente, como algo real. É uma ferramenta, como um martelo, que é amplamente útil e geralmente pode ser usada. Às vezes, essa ferramenta não funciona.

Uma nota matemática nas distribuições normal e Cauchy. Quando os dados são recebidos como uma série temporal, a distribuição normal ocorre apenas quando os erros convergem para zero quando t chega ao infinito. Quando os dados são recebidos como uma série temporal, a distribuição Cauchy acontece quando os erros divergem para o infinito. Um é devido a uma série convergente, o outro devido a uma série divergente. As distribuições de Cauchy nunca chegam a um ponto específico no limite; elas oscilam entre um ponto fixo e, portanto, cinquenta por cento do tempo estão de um lado e cinquenta por cento do outro. Não há reversão mediana.

DE Harris
fonte
9
Há alguma confusão nesta resposta! Por exemplo, diz: "Agora, nas estatísticas bayesianas, existe uma estatística suficiente para os parâmetros da distribuição de Cauchy e, se você usar um uniforme antes, também será imparcial". É difícil entender isso! Primeiro, os conceitos freqüentista e bayesiano de suficiência são muito próximos (e acredito que podem diferir apenas em alguns espaços de amostra estranhos e com dim infinito, portanto, para a linha real são os mesmos). Não há estatística suficiente para o modelo de Cauchy, de dimensão fixa !, simplesmente (os dados completos são obviamente suficientes).
Kjetil b halvorsen
-6

Simplificando, a área sob a curva se aproxima do infinito à medida que você diminui o zoom. Se você experimentar uma região finita, poderá encontrar uma média para essa região. No entanto, não há meios para o infinito.

Paulo
fonte
8
A área no PDF é igual a , por definição; portanto, você deve significar outra coisa com "a curva". O que é isso? 1
whuber