Acabei de realizar uma análise dos meus dados usando regressão logística, mas também sou obrigado a ter uma parte descritiva da Estatística no meu relatório. Sinceramente, não entendo o motivo disso e esperava que alguém pudesse explicar por que é necessário.
Por exemplo, se plotar um histograma de uma das minhas variáveis contínuas independentes e mostrar normalidade ou assimetria, como isso agregará algum valor ao relatório?
Meus dados consistem em uma variável dependente, verdadeira ou falsa, de conseguir um emprego, e a variável independente são notas no meio do semestre, notas nos exames finais e masculino ou feminino.
descriptive-statistics
reporting
user3223190
fonte
fonte
Respostas:
No meu campo, a parte descritiva do relatório é extremamente importante, pois define o contexto para a generalização dos resultados. Por exemplo, um pesquisador deseja identificar os preditores de lesão cerebral traumática após acidentes de motocicleta em uma amostra de um hospital. Sua variável dependente é binária e ela tinha uma série de variáveis independentes. A regressão logística multivariável permitiu que ela produzisse os seguintes achados:
Para ser claro, não houve problemas com a modelagem. Nosso foco é o valor que as estatísticas descritivas podem adicionar.
Sem a estatística descritiva, um leitor não pode colocar essas descobertas em perspectiva. Por quê? Deixe-me mostrar as estatísticas descritivas:
Você pode ver pelo exposto acima que a amostra dela consistia em homens mais velhos e intoxicados. Com essas informações, o leitor pode dizer o que, se houver, esses resultados podem dizer sobre lesões em jovens do sexo masculino ou lesões em motociclistas não intoxicadas ou em motociclistas.
Por favor, não ignore as estatísticas descritivas.
fonte
O objetivo de fornecer estatísticas descritivas é caracterizar sua amostra para que pessoas de outros centros ou países possam avaliar se seus resultados se generalizam para a situação deles. Portanto, no seu caso, tabular o sexo, as notas e assim por diante seria uma adição benéfica à regressão logística. Não é para permitir que as pessoas verifiquem suas suposições, embora possam tentar fazer isso também.
============== Editar para fornecer links para algumas diretrizes usadas na saúde
No campo com o qual eu estou familiarizado, saúde, existem diretrizes específicas para relatórios. Eles foram coletados juntos na rede EQUATOR, que deve ser consultada para obter detalhes atualizados.
Como exemplo, podemos fazer ensaios clínicos em que a diretriz relevante é CONSORT. No documento que descreve as diretrizes disponíveis aqui e em outros lugares , lemos na recomendação da Tabela 1 15 "Uma tabela mostrando as características demográficas e clínicas da linha de base para cada grupo".
Existem recomendações semelhantes para outros tipos de estudo.
fonte
Outra coisa é mostrar como suas variáveis se comportam. Se, por exemplo, uma de suas variáveis é o salário, e você entrevistou exatamente um bilionário, quando você inserir o salário dele na regressão logística dominará sobre todo o resto, provavelmente aprenderá a ignorar o salário, independentemente de quanta informação real pode conter.
Alguns métodos são mais sensíveis do que outros à distorção e valores extremos, e a regressão logística é mais do lado sensível. Obviamente, a prova final está no pudim, e você pode comparar os resultados obtidos com os dados brutos ou com cada recurso transformado em normalidade.
fonte
Uma parte descritiva ajuda a entender o leitor do seu conjunto de dados. Na economia aplicada, geralmente é altamente recomendado, pois pode mostrar as primeiras falhas em potencial em sua análise.
Você pode usar dados de diferentes fontes para expandir seus descritivos.
1 mesa deve ser suficiente. O que você anexou não é muito intuitivo.
fonte