O Problema da Pesca

10

Suponha que você queira pescar no lago das 8h às 20h. Devido à sobrepesca, foi instituída uma lei que diz que você só pode pescar um peixe por dia. Quando você captura um peixe, pode optar por mantê-lo (e, assim, voltar para casa com esse peixe) ou jogá-lo de volta no lago e continuar pescando (mas corre o risco de se instalar com um peixe menor ou nenhum peixe). Você quer pegar o maior peixe possível; especificamente, você deseja maximizar a massa esperada de peixe que leva para casa.

Formalmente, podemos configurar esse problema da seguinte forma: os peixes são capturados em uma determinada taxa (portanto, o tempo necessário para capturar o próximo peixe segue uma distribuição exponencial conhecida) e o tamanho do peixe capturado segue alguma distribuição (também conhecida) . Queremos um processo de decisão que, dado o tempo atual e o tamanho de um peixe que você acabou de capturar, decida manter ou não o peixe.

Portanto, a pergunta é: como essa decisão deve ser tomada? Existe alguma maneira simples (ou complicada) de decidir quando parar de pescar? Penso que o problema é equivalente a determinar, por um determinado período t, qual a massa esperada de peixes que um pescador ideal levaria para casa se eles iniciassem no período t; o processo de decisão ideal manteria um peixe se, e somente se, fosse mais pesado que a massa esperada. Mas isso parece meio auto-referencial; estamos definindo a estratégia de pesca ideal em termos de um pescador ideal e não tenho muita certeza de como proceder.

b2coutts
fonte
5
Confira o problema do secretário na Wikipedia - especificamente a seção sobre a lei 1 / e-law de melhor escolha.
soakley
2
Eu acho que a principal diferença aqui é que se supõe que sabemos como tudo é distribuído, enquanto a chave para essa solução é que ela use os primeiros candidatos 1 / e apenas para obter um pouco desse conhecimento e definir um bom limite. Eu acho que uma idéia semelhante não poderia funcionar aqui. Você pode imaginar apenas derivando um limite das distribuições, mas não acho que deva ser corrigido; Eu acho que o limiar deve diminuir com o tempo, pois você tem cada vez menos tempo para pescar melhor / qualquer peixe.
b2coutts
11
@soakley veja também minha resposta à resposta de olooney; o valor (esperado) da espera depende não apenas das capturas que você obterá no futuro, mas qual delas capturará sua estratégia. Então eu acho que há um aspecto auto-referencial estranho nessa questão também.
Julio
11
Qual é a função ou valor que tentamos otimizar? Ou seja, como pesamos o risco e o lucro? O objetivo é apresentar um método que maximize o valor esperado do tamanho do peixe capturado? Estamos apenas pescando um dia ou vários dias e, no último caso, como os dias estão correlacionados?
Sextus Empiricus
11
Conhecemos a distribuição ... isso se refere apenas ao tipo de distribuição ou também inclui os parâmetros de distribuição?
Sextus Empiricus

Respostas:

4

Seja λ denotado a taxa do processo de Poisson e seja S(x)=1F(x) onde F(x) é a função de distribuição cumulativa da distribuição do tamanho do peixe.

t=0g(t)t0(t,0)g(0)=0xtg(t)

insira a descrição da imagem aqui

g(t)(tdt,t)X>g(t)

λdtS(g(t)),
g(t)

g(t)

E(X|X>g(t))=g(t)+1S(g(t))g(t)S(x)dx.

(tdt,0)

g(tdt)=[λdtS(g(t))][g(t)+1S(g(t))g(t)S(x)dx]+[1λdtS(g(t)]g(t).

g(t)

(1)dgdt=λg(t)S(x)dx.
g(t)λ0S(x)dx

Xexp(α)S(x)=eαx

dgdt=λαeαg(t)
g(t)=1αln(1λt),
t0α=λ=1g(12)

g <- function(t,lambda, rate) {
  1/rate*log(1-lambda*t)
}
catch <- function(daylength=12, lambda=1, rfn=runif, gfn=g, ...) {
  n <- rpois(1,daylength*lambda)
  starttime <- -daylength
  arrivaltimes <- sort(runif(n,starttime,0))
  X <- rfn(n,...)
  j <- match(TRUE, X > gfn(arrivaltimes,lambda,...))
  if (is.na(j))
    0
  else
    X[j]
}
nsim <- 1e+5
catches <- rep(0,nsim)
for (i in 1:nsim)
  catches[i] <- catch(gfn=g,rfn=rexp,rate=1,lambda=1)
> mean(catches)
[1] 2.55802
> g(-12,1,1)
[1] 2.564949

XU(0,1)

g(t)=111λt/2
g(t)t

Jarle Tufto
fonte
3
g(t)(t,0)
11
g(t)(t,0)tg(t)
11
g(t)=1eλt1λt
g(t)