Na página da Wikipedia sobre classificadores ingênuos de Bayes , existe esta linha:
(Uma distribuição de probabilidade acima de 1 é OK. É a área sob a curva da campainha que é igual a 1.)
Como um valor ser bom? Eu pensei que todos os valores de probabilidade estavam expressos no intervalo . Além disso, como é possível ter esse valor, como esse valor é obtido no exemplo mostrado na página?0 ≤ p ≤ 1
distributions
probability
normal-distribution
pdf
babelproofreader
fonte
fonte
p
para a densidade de probabilidade e letras maiúsculasP
para a probabilidadeRespostas:
Essa página do Wiki está abusando da linguagem, referindo-se a esse número como uma probabilidade. Você está certo de que não é. Na verdade, é uma probabilidade por pé . Especificamente, o valor de 1.5789 (para uma altura de 6 pés) implica que a probabilidade de uma altura entre, por exemplo, 5,99 e 6,01 pés, seja próxima ao seguinte valor sem unidade:
Este valor não deve exceder 1, como você sabe. (O pequeno intervalo de alturas (0,02 neste exemplo) é uma parte crucial do aparato de probabilidade. É o "diferencial" da altura, que abreviarei .) As probabilidades por unidade de algo são chamado densidades por analogia com outras densidades, como massa por unidade de volume.d( altura )
As densidades de probabilidade de boa-fé podem ter valores arbitrariamente grandes, mesmo que infinitos.
Este exemplo mostra a função de densidade de probabilidade para uma distribuição gama (com parâmetro de forma de e escala de ). Como a maior parte da densidade é menor que , a curva precisa subir mais que para ter uma área total de conforme necessário para todas as distribuições de probabilidade.1 / 5 1 1 13 / 2 1 / 5 1 1 1
Essa densidade (para uma distribuição beta com os parâmetros ) torna-se infinita em e em . A área total ainda é finita (e é igual a )!0 1 11 / 2 , 1 / 10 0 0 1 1
O valor de 1.5789 / pé é obtido nesse exemplo, estimando-se que as alturas dos machos têm uma distribuição normal com média de 5.855 pés e variação de 3.50e-2 pés quadrados. (Isso pode ser encontrado em uma tabela anterior.) A raiz quadrada dessa variação é o desvio padrão, 0,18717 pés. Expressamos novamente 6 pés como o número de SDs a partir da média:
A divisão pelo desvio padrão produz uma relação
A densidade de probabilidade Normal, por definição, é igual a
(Na verdade, eu trapacei: eu simplesmente pedi ao Excel para calcular NORMDIST (6, 5.855, 0.18717, FALSE). Mas então eu realmente verifiquei a fórmula, apenas para ter certeza.) Quando removemos o diferencial essencial da fórmula, apenas o número permanece, como o sorriso do gato de Cheshire. Nós, leitores, precisamos entender que o número deve ser multiplicado por uma pequena diferença de altura para produzir uma probabilidade.1.5789d( altura ) 1.5789
fonte
Esse é um erro comum de não entender a diferença entre as funções de massa de probabilidade, onde a variável é discreta, e as funções de densidade de probabilidade, onde a variável é contínua. Consulte O que é uma distribuição de probabilidade :
fonte
fonte
Não sei se o artigo da Wikipedia foi editado após as postagens iniciais deste tópico, mas agora diz "Observe que um valor maior que 1 está OK aqui - é uma densidade de probabilidade e não uma probabilidade, porque a altura é uma variável contínua. ", e pelo menos nesse contexto imediato, P é usado para probabilidade ep é usado para densidade de probabilidade. Sim, muito desleixado, pois o artigo usa p em alguns lugares para significar probabilidade e em outros lugares como densidade de probabilidade.
Voltar à pergunta original "Um valor de distribuição de probabilidade superior a 1 pode ser bom?" Não, mas já vi isso (veja meu último parágrafo abaixo).
Veja como interpretar uma probabilidade> 1. Primeiro, observe que as pessoas podem e fazem um esforço de 150%, como geralmente ouvimos em esportes e, às vezes, trabalhamos em https://www.youtube.com/watch?v=br_vSdAOHQQ . Se você tem certeza de que algo acontecerá, essa é uma probabilidade de 1. Uma probabilidade de 1,5 pode ser interpretada, pois você tem 150% de certeza de que o evento acontecerá - como se esforçar 150%.
E se você pode ter uma probabilidade> 1, suponho que você possa ter uma probabilidade <0. Probabilidades negativas podem ser interpretadas da seguinte maneira. Uma probabilidade de 0,001 significa que quase não há chance do evento acontecer. Probabilidade = 0 significa "de jeito nenhum". Uma probabilidade negativa, como -1,2, corresponde a "Você está brincando".
fonte
fonte
O valor do ponto em um valor de parâmetro específico de um gráfico de densidade de probabilidade seria uma probabilidade, certo? Nesse caso, a instrução pode ser corrigida simplesmente alterando P (altura | masculino) para L (altura | masculino).
fonte