Verificando se uma densidade é uma família exponencial

8

Tentando provar que isso não pertence à família exponencial.

f(y|a)=4(y+a)(1+4a);0<y<1,a>0

Aqui está a minha abordagem:

f(y|a)=4(y+a)elog(1+4a)
f(y|a)=(4y)(1+ay)elog(1+4a)

Comparando isto com a forma padrão, e , que tem de ser uma função de apenas , não pode ser definida em termos de sozinho, como na é inseparável. Isso é suficiente para mostrar que essa distribuição não pertence à família exponencial.g ( a ) a a y 1 + ah(y)=4yg(a)aay1+ay

Por favor, revise minha abordagem.

user30438
fonte

Respostas:

7

Você colocou o dedo no cerne da questão e, de fato, o resultado é bastante óbvio, mas a lógica parece um pouco errada. O método descrito abaixo usa repetidamente logaritmos e diferenciação para tornar o problema progressivamente mais simples, até que se torne totalmente trivial.


Por definição, é o PDF de uma família exponencial quando seu logaritmo pode ser escrito como uma soma de algo apenas em termos do parâmetro ( ), algo mais apenas em termos de dados ( ) e outra coisa que é um produto de uma função de e uma função de . Isso significa que você pode ignorar qualquer fator que dependa claramente apenas do parâmetro ou apenas dos dados. Nesse caso, é óbvio que depende apenas de , portanto podemos ignorá-lo. a y a y 4fayay a41+4aa

O problema está em . Precisamos provar que não podem existir funções "agradáveis" e modo que mais alguma função de sozinho mais alguma outra função de sozinho. Que "plus" parte é chata, mas podemos matá-lo através da diferenciação primeira com respeito a (a derivada de qualquer função de por si só será zero) e, em seguida, com respeito a (a derivada de uma função de vontade sozinho seja zero). Ao negar os dois lados (para tornar o lado esquerdo positivo), isso dáη T log ( y + a ) = η ( a ) T ( y ) ay+aηTlog(y+a)=η(a)T(y)aa y y ayayya

2aylog(y+a)=1(a+y)2=η(a)T(y).

Eu quero usar logaritmos para simplificar o lado direito (que, sendo igual ao lado esquerdo, é sempre positivo). Supondo que e sejam contínuos garantirá que existem alguns intervalos de valores para e para nos quais e ou então e . Isso significa que realmente podemos dividir o lado direito em dois fatores positivos, permitindo que o logaritmo seja aplicado. Fazer isso produzT a y - η ( a ) > 0 T ( y ) > 0 η ( a ) > 0 - T ( y ) > 0ηTayη(a)>0T(y)>0η(a)>0T(y)>0

2log(a+y)=log1(a+y)2=log(η(a)T(y))=log(η(a))+log(T(y))

(ou então uma expressão comparável com alguns sinais negativos lançados). Agora vamos jogar o mesmo jogo: em ambos os casos, diferenciando ambos os lados com respeito a ambos e rendimentosyay

2(a+y)2=0,

uma impossibilidade.

Olhando para trás, essa abordagem teve que assumir que e têm segundas derivadas dentro de alguns intervalos de seus argumentos. A análise pode ser feita da mesma maneira, usando diferenças finitas para enfraquecer essas suposições, mas provavelmente não vale a pena.TηT

whuber
fonte
Minha anotação é a da Wikipedia, que também lista um conjunto de regras para identificar famílias exponenciais. . Os métodos ilustrados aqui podem ser usados ​​para justificar essas regras.
whuber
2
Bela análise; o uso de derivadas secundárias parciais mistas é um tanto reminiscente de critérios para verificar se as funções são "nomogramáveis", pelo menos de formas particulares (que também envolvem uma separação semelhante).
Glen_b -Reinstala Monica
Obrigado @Glen_b. Também é mais do que remanescente da análise de interações em tabelas bidirecionais. Essa é a versão de diferenças finitas. ;-)
whuber
Sim; essa também é uma conexão que eu explorei ao jogar com nomogramas.
Glen_b -Reinstala Monica
@ whuber Obrigado pela sua explicação. Mas estou tendo dificuldade para entender por que estamos tomando derivadas parciais e tomando log novamente. Existe a possibilidade de que isso seja resolvido definindo uma função indicadora para y que sempre depende de a.
user30438
1

Será em família exponencial se puder ser escrito em (com outras condições).fh(x)eηT(x)A(η)


Seja . Agora, para quaisquer 4 pontos de dados no espaço de amostra = , que está livre de η. g(x,η)=ηT(x)A(η)x1,x2,x3,x4(g(x1,η)g(x2,η))(g(x3,η)g(x4,η))(T(x1)T(x2))(T(x3)T(x4))

Agora aqui = . Tome .f(y;a)=4y+a(4a+1)4e(ln(y+a)ln(4a+1))g(x,η)=ln(y+a)ln(4a+1)


Então = - que não está livre de a. então não pertence à família exponencial. (ln(y1+a)-ln(y2+a))(g(x1,η)g(x2,η))(g(x3,η)g(x4,η))(ln(y1+a)ln(y2+a))(ln(y3+a)ln(y4+a))f(y;a)

Mriganka Aulia
fonte
+1 Gosto da abordagem direta. Indica claramente como as diferenças finitas podem ser usadas para isolar o comportamento chave de . f
whuber