Integração Monte Carlo para funções integráveis ​​não quadradas

9

Espero que este seja o lugar certo para perguntar, se não estiver à vontade para movê-lo para um fórum mais apropriado.

Há algum tempo que me pergunto como tratar funções integráveis ​​não quadradas com a Integração Monte Carlo. Eu sei que o MC ainda fornece uma estimativa adequada, mas o erro é irrealizável (divergente?) Para esse tipo de função.

Vamos nos restringir a uma dimensão. A integração de Monte Carlo significa que aproximamos a integral

Eu=0 01 1dxf(x)

usando a estimativa

E=1 1NEu=1 1Nf(xEu)

com pontos aleatórios distribuídos uniformemente. A lei dos grandes números garante que . A variação da amostraE IxEu[0 0,1 1]EEu

S2=1 1N-1 1Eu=1 1N(f(xEu)-E)2

aproxima a variância da distribuição induzida por . No entanto, se não for quadrado-integrável, ou seja, a integral da função quadrada diverge, isso implica f fσ2ff

σ2=0 01 1dx(f(x)-Eu)2=0 01 1dxf2(x)-Eu2

significando que também a variação diverge.

Um exemplo simples é a função

f(x)=1 1x

para o qual e .σ2=10dxEu=0 01 1dx1 1x=2σ2=0 01 1dx(1 1x-2)=[emx-2x]0 01 1

Se é finito, pode-se aproximar o erro da média por , mas e se não é quadrado-integrável? E Sσ2E f(x)SNσNf(x)

cschwan
fonte
11
Não entendi: você começa observando que nenhum dos tem uma variação e depois pergunta se a variação de sua média seria um estimador razoável de - essa variação inexistente! Ou interpreto mal esta pergunta: talvez por "estimativas estatisticamente independentes" você tenha em mente algum estimador diferente (talvez robusto) da integral? EEu
whuber
Eu não disse que não tem uma variação, apenas que não posso definir uma variação para ela por . Portanto, a questão é saber se posso definir um erro em tudo e se é um candidato razoável. Por estatisticamente independente, quero dizer que os são obtidos usando números aleatórios diferentes, por exemplo, usando geradores de números aleatórios semeados de maneira diferente (espero que seja o termo certo então). S 2 ˉ S 2 E iES2S¯2EEu
cschwan
Por favor, explique o que você quer dizer com "não sendo possível definir uma variação para ". Não consigo entender isso usando as definições padrão de variância e . S 2S2S2
whuber
Bem, a função não é quadrada-integrável, portanto, se não me engano, deve divergir . Se esse for o caso, a definição para não faz sentido em primeiro lugar, certo? Por meio do teorema do limite central, no entanto, ainda convergirá para o verdadeiro valor da integral, mas sem um erro, esse valor por si só não faz sentido (quão bom é esse resultado?). S 2 ES2S2E
cschwan
Desculpe, eu quis dizer "lei dos grandes números", é claro, não CLT.
cschwan

Respostas:

2

Você pode apenas usar outras medidas de escala / dispersão, como a faixa interquantil, que não são afetadas pelos assintóticos da cauda e, portanto, pela integrabilidade quadrada. Com o benefício adicional de que, geralmente, eles são geralmente mais robustos de qualquer maneira.

Obviamente, deve-se aplicá-las a uma reamostragem / bootstrap seguida pelo estimador médio, não diretamente apenas à saída bruta da amostragem MC da função antes da média. Você também pode verificar em geral os estimadores L e adaptar um deles para mesclar essas duas etapas em uma para desempenho, mas mentalmente as duas distribuições não devem ser confundidas, mesmo que o PDF do estimador herde naturalmente algumas características (incluindo talvez a falta de quadrados). integrabilidade).

Quartzo
fonte
+1, devo acrescentar que a lei dos grandes números não requer segundos, portanto, este é um conselho perfeitamente bom.
Mvctas
Obrigado pela sua resposta! Devo admitir que li esses termos pela primeira vez, mas, ao consultá-los no WP, acho que sua resposta me aponta na direção certa. Você ou outra pessoa poderia sugerir alguns artigos ou livros que expliquem os assuntos com mais detalhes?
cschwan
Percebo agora que talvez minha resposta não tenha sido clara. Como você está simulando, você realmente não precisa de reamostragem / bootstrapping, em teoria você pode apenas adicionar novas amostras e obter uma distribuição empírica para o estimador médio. Somente se os recursos forem preocupantes, você poderá pré-calcular médias parciais e reamostrá-las, mas as estatísticas não serão triviais se bem executadas. Eu não sou especialista em boostrap, então deixarei conselhos sobre isso para outras pessoas, apenas gostaria de salientar se você precisa ir além da formulação direta. Concentre-se nas medidas de dispersão primeiro e otimize depois.
quartzo
O estimador médio proposto não possui uma variação finita. Não importa se adicionamos mais amostras, a distribuição empírica do estimador TAMBÉM terá variância não finita. Você pode confirmar isso com algumas simulações.
rajb245
11
Certamente, isso é o que estava sendo discutido e a razão pela qual alguém deve usar outra medida de dispersão.
Quartz