Eu tenho 5 variáveis e estou tentando prever minha variável de destino, que deve estar dentro do intervalo de 0 a 70. Como uso essas informações para modelar melhor meu
Eu tenho 5 variáveis e estou tentando prever minha variável de destino, que deve estar dentro do intervalo de 0 a 70. Como uso essas informações para modelar melhor meu
Estamos trabalhando com algumas regressões logísticas e percebemos que a probabilidade média estimada sempre é igual à proporção de uma na amostra; isto é, a média dos valores ajustados é igual à média da amostra. Alguém pode me explicar o motivo ou me dar uma referência para encontrar essa...
Durante um experimento para classificação de texto, eu encontrei o classificador de cume gerando resultados que constantemente superam os testes entre os classificadores que são mais comumente mencionados e aplicados para tarefas de mineração de texto, como SVM, NB, kNN, etc. Embora eu não tenha...
Atualização : desculpe por outra atualização, mas encontrei algumas soluções possíveis com polinômios fracionários e o pacote de risco concorrente com o qual preciso de ajuda. O problema Não consigo encontrar uma maneira fácil de fazer uma análise de coeficiente dependente do tempo em R. Quero...
Suponha que executamos uma regressão linear simples , salvamos os resíduos e desenhamos um histograma de distribuição de resíduos. Se obtivermos algo que se parece com uma distribuição familiar, podemos assumir que nosso termo de erro tem essa distribuição? Digamos, se descobrimos que os resíduos...
Eu me pergunto por que usamos a suposição gaussiana ao modelar o erro. No curso de ML de Stanford , o Prof Ng o descreve basicamente de duas maneiras: É matematicamente conveniente. (Está relacionado ao ajuste dos mínimos quadrados e fácil de resolver com pseudoinverso) Devido ao Teorema do...
Estou conduzindo um experimento com o seguinte: DV: Consumo de fatia (contínuo ou pode ser categórico) IV: Mensagem íntegra, mensagem não íntegra, nenhuma mensagem (controle) (3 grupos nos quais as pessoas são designadas aleatoriamente - categóricas) Esta é uma mensagem manipulada sobre a...
Essa é uma pergunta básica nos modelos da Box-Jenkins MA. Como eu entendo, um modelo MA é, basicamente, uma regressão linear de séries temporais valores YYY contra anterior termos de erro et,...,et−net,...,et−ne_t,..., e_{t-n} . Isto é, a observação YYY é primeiro regredido contra a sua valores...
Eu tenho seis variáveis dependentes (dados de contagem) e várias variáveis independentes, vejo que em um MMR o script é assim: my.model <- lm(cbind(DV1,DV2,DV3,DV4,DV5,DV6) ~ IV1 + IV2 + ... + IVn) Mas, como meus dados são contados, quero usar um modelo linear generalizado e tentei o...
Estou fazendo uma regressão linear com uma variável dependente transformada. A transformação a seguir foi feita para que a suposição de normalidade dos resíduos se mantivesse. A variável dependente não transformada foi inclinada negativamente e a transformação a seguir tornou-a quase...
Eu tenho duas séries temporais: Um proxy para o prêmio de risco de mercado (ERP; linha vermelha) A taxa livre de risco, representada por um título do governo (linha azul) Quero testar se a taxa livre de risco pode explicar o ERP. Por este meio, segui basicamente o conselho de Tsay (2010, 3ª...
Estou implementando Ridge Regression em um módulo Python / C e me deparei com esse "pequeno" problema. A idéia é que eu queira provar os graus efetivos de liberdade mais ou menos igualmente espaçados (como o gráfico na página 65, nos "Elementos do aprendizado estatístico" ), ou seja, exemplo: que...
Dada uma variável dependente contínua y e variáveis independentes, incluindo uma variável ordinal X 1 , como encaixar um modelo linear R? Existem documentos sobre esse tipo de
Explique brevemente O que se entende por interpolação. Como isso está relacionado ao conceito de regressão? interpolação é arte de ler nas entrelinhas de uma tabela e, em matemática elementar, o termo geralmente denota o processo de calcular os valores intermediários de uma função a partir de um...
Fiz uma regressão com 4 variáveis, e todas são estatisticamente significativas, com valores de T e (digo porque parece irrelevante incluir os decimais), que são muito altos e claramente significativos. Mas então o é apenas 0,2224. Estou interpretando mal os valores t aqui para significar algo que...
Eu tenho um conjunto de dados sobre ensaios agrícolas. Minha variável de resposta é uma taxa de resposta: log (tratamento / controle). Estou interessado no que medeia a diferença, por isso estou executando meta-regressões de ER (sem ponderação, porque parece bastante claro que o tamanho do efeito...
tl; dr - para regressão OLS, um R-quadrado mais alto também implica um valor-P mais alto? Especificamente para uma única variável explicativa (Y = a + bX + e), mas também estaria interessado em saber para n múltiplas variáveis explicativas (Y = a + b1X + ... bnX + e). Contexto - estou executando...
Eu queria saber se existe uma relação entre e um teste-F.R2R2R^2 Normalmente, R2=∑(Y^t−Y¯)2/T−1∑(Yt−Y¯)2/T−1R2=∑(Y^t−Y¯)2/T−1∑(Yt−Y¯)2/T−1R^2=\frac {\sum (\hat Y_t - \bar Y)^2 / T-1} {\sum( Y_t - \bar Y)^2 / T-1} e mede a intensidade da relação linear na regressão. Um teste F apenas prova uma...
Estou realmente impressionado com o fato de o Poisson GLM aceitar números não inteiros! Veja: Dados (conteúdo de data.txt): 1 2001 0.25 1 1 2002 0.5 1 1 2003 1 1 2 2001 0.25 1 2 2002 0.5 1 2 2003 1 1 Script R: t <- read.table("data.txt") names(t) <- c('site', 'year', 'count', 'weight') tm...
Eu não entendo a explicação no Rarquivo de ajuda de effects () : Para um modelo linear ajustado por lmou aov, os efeitos são os valores não correlacionados de grau único de liberdade obtidos projetando os dados nos sucessivos subespaços ortogonais gerados pela decomposição QR durante o processo...