Esse tipo de distribuição é separado (EX: Binomial, Bernoulli, Multinomial) ou qualquer distribuição pode ser representada dessa maneira. Alguém pode elaborar com exemplo simples
probability
distributions
subha
fonte
fonte
Variáveis categóricas possuem conjuntos finitos de valores discretos. Exemplos incluem sexo (masculino / feminino), país, planeta etc. Contraste isso com variáveis contínuas, que podem receber um número infinito de valores diferentes. Exemplos incluem peso, longitude, distância etc.
Observe que informações semelhantes às vezes podem ser expressas de maneira categórica e contínua; por exemplo,
planet = earth
pode ser expresso comodistance to sun = 1 astronomical unit ≈ 150 million kilometers
. No entanto, não há realmente nenhuma maneira de expressar 200 milhões de quilômetros do sol em termos de planetas, porque não há planeta lá (Marte está a 228 milhões de quilômetros do sol). O mesmo vale para 201 milhões de km, 202 etc. Tudo o que você poderia dizer sobre essas distâncias em termos de planetas éplanet = none
; você não poderia dizerplanet = 4/3×earth
ou.88×Mars
, porque não há maneira significativa de multiplicar um planeta ou qualquer outra variável categórica. Em termos de planetas, essas distâncias seriam indistinguíveis, mas é claro que fazem sentido como distâncias distintas do sol quando expressas como tais - como uma variável contínua.Também é possível expressar variáveis contínuas com precisão arbitrária (por exemplo, uma unidade astronômica é 149.597.871 km, não exatamente 150 milhões de km). Por outro lado, não há como expressar com
planet = earth
mais precisão; Terra é exatamente terra, nem mais nem menos. Além disso, não faria sentido dizer que qualquer outro planeta é "mais" ou "menos" que a Terra seplanet
for uma variável nominal. Poderia ser codificado como uma variável ordenada (ordinal) - os planetas são ordenados em termos de distância ao sol, volume, número de luas, etc. Esses números são todos contínuos em seus próprios termos (ou pelo menos contam, que são discretos mas não categórico), mas não em termos de planetas. Por exemplo, se os planetas são ordenados pela distância do sol ou pelo número de luasmars > earth > venus
,. Se planetas são ordenados por volume,earth > venus > mars
. Não é necessário ordenar variáveis categóricas e talvez algumas não possam ser ordenadas, mas adicionar ordem não as torna menos categóricas.Como a Wikipedia diz, distribuições categóricas são generalizações da distribuição de Bernoulli para mais de dois valores possíveis (a distribuição de Bernoulli é estritamente binária). A distribuição de Bernoulli também é um caso especial da distribuição binomial, mas eu não chamaria a distribuição binomial de categórica (é discreta, mas uma variável de contagem, para que as distâncias entre os valores sejam definidas). Distribuições multinomiais podem estar em conflito com distribuições categóricas, mas a Wikipedia adverte contra isso .
fonte