Quais são as suposições usuais para a regressão linear? Eles incluem: uma relação linear entre a variável independente e dependente erros independentes distribuição normal de erros homoscedasticidade Existem
Refere-se às condições sob as quais um procedimento estatístico gera estimativas e / ou inferência válidas. Por exemplo, muitas técnicas estatísticas exigem a suposição de que os dados são amostrados aleatoriamente de alguma forma. Os resultados teóricos sobre estimadores geralmente requerem suposições sobre o mecanismo de geração de dados.
Quais são as suposições usuais para a regressão linear? Eles incluem: uma relação linear entre a variável independente e dependente erros independentes distribuição normal de erros homoscedasticidade Existem
Atualmente, estou trabalhando em um trabalho de pesquisa quase experimental. Eu só tenho um tamanho de amostra de 15 devido à baixa população na área escolhida e que apenas 15 se enquadram nos meus critérios. 15 é o tamanho mínimo da amostra para calcular para o teste t e o teste F? Em caso...
Para um estudo de simulação, eu tenho que gerar variáveis aleatórias que mostram uma correlação pré-definida (população) com uma variável existente YYY. Examinei os Rpacotes copulae CDVineque podem produzir distribuições multivariadas aleatórias com uma determinada estrutura de dependência. No...
A página da Wikipedia na ANOVA lista três suposições , a saber: Independência de casos - esta é uma suposição do modelo que simplifica a análise estatística. Normalidade - as distribuições dos resíduos são normais. Igualdade (ou "homogeneidade") de variações, chamada homoscedasticidade ... O...
Suponho que fico frustrado toda vez que ouço alguém dizer que a não normalidade de resíduos e / ou heterocedasticidade viola as suposições do OLS. Para estimar parâmetros em um modelo OLS, nenhuma dessas suposições é necessária pelo teorema de Gauss-Markov. Vejo como isso é importante no Teste de...
Existem vários tópicos neste site que discutem como determinar se os resíduos do OLS são normalmente distribuídos normalmente assintoticamente . Outra maneira de avaliar a normalidade dos resíduos com o código R é fornecida nesta excelente resposta . Esta é outra discussão sobre a diferença prática...
Estou aprendendo a análise de sobrevivência deste post na UCLA IDRE e fui enganado na seção 1.2.1. O tutorial diz: ... se se sabia que os tempos de sobrevivência eram distribuídos exponencialmente , então a probabilidade de observar um tempo de sobrevivência ... Por que se supõe que os tempos...
Considere a figura a seguir dos Modelos Lineares de Faraway com R (2005, p. 59). O primeiro gráfico parece indicar que os resíduos e os valores ajustados não estão correlacionados, pois deveriam estar em um modelo linear homoscedástico com erros normalmente distribuídos. Portanto, as segunda e...
Estou trabalhando com um grande conjunto de dados (confidencial, portanto não posso compartilhar muito) e concluí que seria necessária uma regressão binomial negativa. Eu nunca fiz uma regressão glm antes e não consigo encontrar nenhuma informação clara sobre quais são as suposições. Eles são...
Minha pergunta sai desse comentário em um post de Andrew Gelman no blog em que ele defende o uso de intervalos de confiança de 50% em vez de intervalos de confiança de 95%, embora não com base em que eles sejam estimados com mais robustez: Eu prefiro intervalos de 50% a 95% por 3 razões:...
Estou tentando entender o que significa a suposição de observações independentes . Algumas definições são: "Dois eventos são independentes se e somente se P(a∩b)=P(a)∗P(b)P(a∩b)=P(a)∗P(b)P(a \cap b) = P(a) * P(b) ." ( Dicionário de Termos Estatísticos ) "a ocorrência de um evento não altera a...
Como exemplo, considere o ChickWeightconjunto de dados em R. A variação obviamente aumenta com o tempo, portanto, se eu usar uma regressão linear simples como: m <- lm(weight ~ Time*Diet, data=ChickWeight) Minhas perguntas: Quais aspectos do modelo serão questionáveis? Os problemas estão...
Ao ajustar um modelo de regressão, o que acontece se as suposições das saídas não forem atendidas, especificamente: O que acontece se os resíduos não forem homocedásticos? Se os resíduos mostrarem um padrão crescente ou decrescente na plotagem Residuais vs. Ajustados. O que acontece se os...
Aprendi que devo testar a normalidade não nos dados brutos, mas em seus resíduos. Devo calcular os resíduos e depois fazer o teste W de Shapiro-Wilk? Os resíduos são calculados como: ?XEu- médiaXEu-significarX_i - \text{mean} Consulte esta pergunta anterior para meus dados e o...
O teste de Mantel é geralmente aplicado a matrizes simétricas de distância / diferença. Pelo que entendi, uma suposição do teste é que a medida usada para definir diferenças deve ser pelo menos uma semi-métrica (atenda aos requisitos padrão de uma métrica, mas não à desigualdade do triângulo). A...
Quero criar um modelo logístico a partir dos dados da minha pesquisa. É uma pequena pesquisa de quatro colônias residenciais nas quais apenas 154 entrevistados foram entrevistados. Minha variável dependente é "transição satisfatória para o trabalho". Eu descobri que, dos 154 entrevistados, 73...
Executei um projeto repetido, no qual testei 30 homens e 30 mulheres em três tarefas diferentes. Quero entender como o comportamento de homens e mulheres é diferente e como isso depende da tarefa. Eu usei o pacote lmer e o lme4 para investigar isso, no entanto, estou tentando verificar suposições...
Eu li que o teste t é "razoavelmente robusto" quando as distribuições das amostras saem da normalidade. Obviamente, é a distribuição amostral das diferenças que são importantes. Eu tenho dados para dois grupos. Um dos grupos é altamente inclinado na variável dependente. O tamanho da amostra é...
Estou um pouco confuso sobre quais são os pressupostos da regressão linear. Até agora, verifiquei se: todas as variáveis explicativas se correlacionaram linearmente com a variável resposta. (Esse foi o caso) houve colinearidade entre as variáveis explicativas. (houve pouca colinearidade). as...
Considere o modelo padrão para regressão múltipla onde , para que normalidade, homoscedasticidade e não correlação de erros sejam .ε ∼ N ( 0 , σ 2 I n )Y= Xβ+ εY=Xβ+εY=X\beta+\varepsilonε ∼ N( 0 , σ2Eun)ε∼N(0,σ2In)\varepsilon \sim \mathcal N(0, \sigma^2I_n) Suponha que realizamos uma regressão de...