Eu tenho o seguinte tipo de dados (codificado em R):
v.a = c('cat', 'dog', 'dog', 'goat', 'cat', 'goat', 'dog', 'dog')
v.b = c(1, 2, 1, 2, 1, 2, 1, 2)
v.c = c('blue', 'red', 'blue', 'red', 'red', 'blue', 'yellow', 'yellow')
set.seed(12)
v.d = rnorm(8)
aov(v.a ~ v.b + v.c + v.d) # Error
Gostaria de saber se o valor de v.b
ou o valor de v.c
tem alguma capacidade de prever o valor de v.a
. Eu executaria uma ANOVA (como mostrado acima), mas acho que não faz sentido, pois minha variável de resposta não é ordinal (é categórica). O que devo fazer?
r
logistic
anova
categorical-data
multinomial
Remi.b
fonte
fonte
Respostas:
Você pode usar QUALQUER classificador. Incluindo Discriminantes Lineares, logit multinomial como Bill apontou, Support Vector Machines, Redes Neurais, CART, floresta aleatória, árvores C5, há um mundo de modelos diferentes que podem ajudá-lo a prever usando e . Aqui está um exemplo usando a implementação R da floresta aleatória:v . uma v . b v . c
Claramente, essas variáveis não mostram uma relação forte.
fonte
Essa é uma resposta prática mais parcial, mas funciona para mim fazer alguns exercícios antes de me aprofundar na teoria .
Esse link ats.ucla.edu é uma referência que pode ajudar a começar a entender sobre a regressão logística multinomial (como apontado por Bill), de uma maneira mais prática.
Apresenta código reproduzível para entender a função
multinom
donmet
pacoteR
e também fornece um resumo sobre a interpretação das saídas.Considere este código:
É assim que você pode interpretar o modelo de logística multinomial ajustada log-linear:
Aqui está um trecho sobre como os parâmetros do modelo podem ser interpretados:
a mesma lógica para a segunda linha, mas, considerando "cabra" vs. "gato" com ( = -47,72585).b24
.....
Há muito mais no artigo, mas eu pensei que essa parte fosse o núcleo.
Referência:
R Exemplos de análise de dados: Regressão logística multinomial. UCLA: Grupo de Consultoria Estatística.
de http://www.ats.ucla.edu/stat/r/dae/mlogit.htm (acessado em 05 de novembro de 2013).
fonte