Essa quantidade relacionada à independência tem um nome?

18

Obviamente, os eventos A e B são independentes se Pr = Pr Pr . Vamos definir uma quantidade relacionada Q:(AB)(A)(B)

QPr(AB)Pr(A)Pr(B)

Então A e B são independentes se Q = 1 (assumindo que o denominador é diferente de zero). Q realmente tem um nome? Eu sinto que isso se refere a algum conceito elementar que está me escapando agora e que eu me sentirei bastante tolo por perguntar isso.

Michael McGowan
fonte
1
Eu acho que depende do contexto. Observe que para que \ Pr (A | B) = Q \ Pr (A) e \ Pr (B | A) = Q \ Pr (B) . Este formulário tem mais um sabor de inferência bayesiana. Pr(A|B)=QPr(A)Pr(B|A)=QPr(B)
Q=Pr(A|B)Pr(A)=Pr(B|A)Pr(B)
Pr(A|B)=QPr(A)Pr(B|A)=QPr(B)
vqv
Esse SE poderia ter outras perguntas "bastante tolas". É muito intimidador, mesmo para quem gosta de estatísticas básicas de graduação. 1 para disparate
naught101
1
Vá em "Migdal Probability";)
Bitwise
1
@PiotrMigdal Obrigado pela gentil oferta. Eu preferiria ver sua própria resposta. Talvez incluindo como você fez essa pergunta e como essa quantidade pode ser útil.

Respostas:

14

Observa- se a proporção esperada (abreviação: o / e ).

Citando uma resposta para Sobre a probabilidade conjunta dividida pelo produto das probabilidades no Math.SE (apontado pelo procrastinador ):

Então, pelo menos na literatura ambiental, médica e das ciências da vida, P (A∩B) / (P (A) P (B)) é chamada de razão observada para a esperada (abreviação o / e). A idéia é que o numerador seja a probabilidade real de A∩B enquanto o denominador é o que seria se A e B fossem independentes.

Piotr Migdal
fonte
11

Eu acho que você está procurando Lift(ou melhoria). Lift é a razão da probabilidade de que A e B ocorram juntos para o múltiplo das duas probabilidades individuais de A e B. É usado para interpretar a importância de uma regra na mineração de regras de associação . A elevação é uma maneira de medir o quão melhor um modelo está acima do benchmark e é definida como a confiança dividida pelo benchmark, em que qualquer valor maior que aquele sugere que há alguma utilidade para a regra. Veja esta página também como outro exemplo.

George Dontas
fonte
(+1) Boa resposta. A vinheta das arules também tem boas referências sobre levantamento .
chl
Obrigado, provavelmente é onde eu já vi isso antes. Acho que já vi uma definição ligeiramente diferente no contexto de aprendizado de máquina ... Odeio que às vezes haja falta de consenso sobre uma definição, enquanto outras vezes há muitos termos para o mesmo conceito.
Michael McGowan
8

O pessoal da análise de correspondência chama uma dessas quantidades de razão de contingência , no contexto de contagens cruzadas. As distâncias de múltiplas proporções de 1 são o que os biplots visualizam. Ver, por exemplo, Greenacre (1993), cap.13.

O pessoal da seleção de recursos de aprendizado de máquina da velha escola chama o registro dessa quantidade de informações mútuas pontuais . Ver, por exemplo, Manning e Schütze (1999) p.66.

conjugado
fonte
Obrigado por apontar "taxa de contingência" e "informações mútuas pontuais".
Piotr Migdal
6

Na mineração de dados, parece que eles chamam esse aumento .

RichardN
fonte
0

Talvez você esteja perguntando como essa quantidade está relacionada ao Odds Ratio, como uma quantidade para medir a independência.

Eu acho que você está procurando por "Relação com independência estatística". Veja http://en.wikipedia.org/wiki/Odds_ratio

Kenneth Cabrera
fonte