Fiz um modelo de regressão logística que inclui um termo polinomial até o grau 2. Estou ciente de que a regressão logística modela a variável de resposta como uma função não linear dos preditores. Faz sentido incluir um termo polinomial na regressão
Fiz um modelo de regressão logística que inclui um termo polinomial até o grau 2. Estou ciente de que a regressão logística modela a variável de resposta como uma função não linear dos preditores. Faz sentido incluir um termo polinomial na regressão
Venho brincando com a regressão logística com vários algoritmos de otimização de lote (gradiente conjugado, newton-raphson e vários métodos de quasinewton). Uma coisa que notei é que, às vezes, adicionar mais dados a um modelo pode tornar o treinamento do modelo muito menos demorado. Cada iteração...
Você conhece Bradley Efron ? Ele é um ótimo homem. Como Efron imaginou ou pensou em "bootstrap" pela primeira
Tenho dificuldades com as probabilidades . Eu entendo o Teorema de Bayes p(A|B,H)=p(B|A,H)p(A|H)p(B|H)p(A|B,H)=p(B|A,H)p(A|H)p(B|H)p(A|B, \mathcal{H}) = \frac{p(B|A, \mathcal{H}) p(A|\mathcal{H})}{p(B|\mathcal{H})} que pode ser deduzido diretamente da aplicação de
Vindo de um background em ciências sociais e epidemiologia, meus colegas de trabalho foram treinados em regressão de mínimos quadrados, regressão logística e análise de sobrevivência. Eles gostam de ver intervalos de confiança de 95% e valores de p com os coeficientes de parâmetro e desconfiam das...
Deixe uma função que, dada alguma hipótese retorne o erro de generalização para esse fixo .E( H )E(h)\mathcal{E(h)}hhhhhh Eu estava lendo algumas notas sobre seleção de modelo e erro de generalização e dizia: "Se tivéssemos acesso a , também não haveria problema de seleção de modelos....
Sou um pouco novato em R e seleção de recursos e tentei o pacote Boruta para selecionar (diminuir) meu número de variáveis (n = 40). Eu pensei que esse método também levasse em conta a possível correlação entre variáveis, no entanto, duas (das 20 variáveis selecionadas) são altamente...
Suponha que eu tenha uma função como: f <- function(x){ exp(x) / (1 + exp(x)) } ele deve funcionar com qualquer valor real de x, mas na verdade ele retorna NaN quando x é 710 ou maior. Gostaria de saber qual é a maneira correta de lidar com esse problema. Sei que é fácil fazê-lo retornar...
O livro de Kevin Murphy discute um problema bayesiano hierárquico clássico (originalmente discutido em Johnson and Albert, 1999, p24): Suponha que estamos tentando estimar a taxa de câncer em cidades. Em cada cidade, amostramos um número de indivíduos e medimos o número de pessoas com câncer ,...
Entendo o modelo AR (p): sua entrada é a série temporal sendo modelada. Estou completamente paralisado ao ler sobre o modelo MA (q): sua entrada é inovação ou choque aleatório, como costuma ser formulado. O problema é que não consigo imaginar como obter um componente de inovação que ainda não...
Meus dados consistem em várias medições contínuas e em algumas variáveis fictícias que representam os anos em que as medições foram feitas. Agora, quero aprender uma rede neural com os dados. Portanto, estou normalizando o zScore de todas as variáveis, incluindo as variáveis dummy. No entanto,...
Essa é uma pergunta bastante genérica: suponha que eu queira construir um modelo para prever a próxima observação com base nas observações anteriores de ( N pode ser um parâmetro para otimizar experimentalmente). Portanto, basicamente temos uma janela deslizante de recursos de entrada para prever a...
Por que as medidas de dispersão são calculadas em relação a algum ponto central? Por que, por exemplo, todas as possíveis diferenças não repetidas e emparelhadas no conjunto de dados não seriam uma medida válida de
Esta pergunta já tem respostas aqui : Meu modelo é bom, com base no valor da métrica de diagnóstico ( / AUC / precisão / RMSE etc.)? R2R2R^2 (3 respostas) Fechado há 7 meses . Eu tenho dados de aprendizagem que consistem em ~ 45k amostras, cada uma com 21...
Dado o seguinte quadro de dados: df <- data.frame(x1 = c(26, 28, 19, 27, 23, 31, 22, 1, 2, 1, 1, 1), x2 = c(5, 5, 7, 5, 7, 4, 2, 0, 0, 0, 0, 1), x3 = c(8, 6, 5, 7, 5, 9, 5, 1, 0, 1, 0, 1), x4 = c(8, 5, 3, 8, 1, 3, 4, 0, 0, 1, 0, 0), x5 = c(1, 1, 1, 1, 1, 0, 1, 0, 0, 0, 0, 0), x6 = c(2, 3,...
Entendo que os coeficientes de uma equação logística podem ser interpretados como uma razão ímpar. Se um termo de regularização é adicionado ao controle para o ajuste excessivo, como isso altera a interpretação dos
Eu uso o pacote bnlearn em R para aprender a estrutura da minha rede bayesiana e seus parâmetros. O que eu quero fazer é "prever" o valor de um nó, dado o valor de outros nós como evidência (obviamente, com exceção do nó cujos valores estamos prevendo). Eu tenho variáveis contínuas....
Deve-se sempre esperar que a tendência central (isto é, média e / ou mediana) de uma amostra com bootstrap seja semelhante ao valor observado? Nesse caso em particular, tenho respostas distribuídas exponencialmente para sujeitos em duas condições (não realizei o experimento, só tenho os dados)....
Corri uma curva de sobrevivência do censor de intervalo com R, JMP e SAS. Ambos me deram gráficos idênticos, mas as tabelas diferiram um pouco. Essa é a tabela que o JMP me deu. Start Time End Time Survival Failure SurvStdErr . 14.0000 1.0000 0.0000 0.0000 16.0000 21.0000 0.5000 0.5000...
Digamos que eu tenha uma grande amostra de valores em . Gostaria de estimar a distribuição subjacente . A maioria das amostras vem dessa distribuição assumida , enquanto o restante são discrepantes que eu gostaria de ignorar na estimativa de e .Beta ( α , β ) Beta ( α , β ) α...