Estou me envolvendo com os tipos de dados e preciso de ajuda:
Se você olhar a figura acima (tirada daqui ), ela tem os tipos de dados como este:
- Quantitativo (Discreto, Contínuo)
- Qualitativo (Nominal (N), Ordinal (O), Binário (B)).
Mas se você olhar para a próxima foto ( daqui ), as categorias são:
- Quantitativo (Discreto (NOB))
- Qualitativa
Uma imagem possui NOB sob Qualitativa, a outra possui Quantitativa. Qual deles está correto?
categorical-data
dataset
ordinal-data
binary-data
Inclinando-se
fonte
fonte
Respostas:
Essas tipologias podem facilmente confundir tanto quanto explicam.
Por exemplo, dados binários, como introduzido em muitos textos ou cursos introdutórios, certamente soa qualitativo: sim ou não, sobreviveu ou morreu, presente ou ausente, homem ou mulher, qualquer que seja. Mas marque as duas possibilidades 1 ou 0 e tudo será perfeitamente quantitativo. Essa pontuação é a base de todos os tipos de análises: a proporção de mulheres é apenas a média de vários 0s para homens e 1s para mulheres. Se eu encontrar 7 mulheres e 3 homens, posso calcular em média 1, 1, 1, 1, 1, 1, 1, 0, 0, 0 para obter a proporção 0,7. Com as respostas binárias, você tem um amplo caminho aberto para logitar e probitar a regressão, e assim por diante, que se concentram na variação na proporção, fração ou probabilidade sobrevivida, ou algo semelhante, com o que mais a controla ou influencia. Ninguém precisa se preocupar com a codificação ser arbitrária. A proporção masculina é apenas 1 menos a proporção feminina,
Quase o mesmo acontece quando dados nominais ou ordinais estão sendo considerados, pois qualquer análise desses dados depende da primeira contagem de quantos se enquadram em cada categoria e você pode ser quantitativo quanto desejar. Os gráficos de pizza e de barras, como encontrados pela primeira vez nos primeiros anos, mostram que, portanto, é intrigante quantas contas perdem isso nas explicações.
Dito de outra forma, você pode classificar os dados brutos ou originais como relatados pela primeira vez e como aparecem na célula de uma planilha ou banco de dados. Mas sua forma original não é imutável. Imagine algo severo como uma morte de perplexidade por ler muitos livros superficiais. Isso pode ser escrito em um certificado, mas a análise estatística nunca pára por aí. Há uma agregação de contagens (quantas dessas mortes em uma área e um período), uma redução nas taxas (quantas em relação à população em risco) e assim por diante.
Portanto, como os dados são codificados pela primeira vez raramente inibe seu uso de outras formas e a transformação para outras formas. A etimologia dos dados é aqui reveladora: traduzindo o latim original literalmente, eles são dados a você, mas não há regra contra convertê-los para muitas outras formas.
fonte
Não consegui encontrar uma imagem que reunisse tudo, então criei uma com base no que tenho estudado. Colocar as escalas de medida no mesmo diagrama com os tipos de dados estava me confundindo, então tentei mostrar que há uma distinção lá.
Agradeço sua ajuda e pensamentos! Atenciosamente, Inclinado
fonte
Depende do que você quer dizer com "dados quantitativos" e "dados qualitativos".
Acho que os dois sites citados estão usando os termos de maneira diferente. Suponha, por exemplo, que você pergunte às pessoas:
Que tipo de dados são esses? A variável é nominal: são apenas nomes, não há ordem para isso. Mas muitas pessoas chamariam isso de quantitativo, porque o principal é quantas escolhem qual candidato. Isso é o contrário de dados qualitativos, que podem ser transcrições de entrevistas sobre o que eles mais gostam em Obama (ou Romney ou quem quer que seja).
Uma maneira melhor de analisar isso é distinguir claramente os dados quantitativos das variáveis quantitativas.
fonte
Nenhum desses gráficos está correto. Eles são um tanto absurdos e você tem razão em ficar confuso (além da contradição).
Eles parecem conflitar as idéias do tipo de variável fundamental e seleção de variáveis para modelar um sistema (com um pdf).
Existem 3 tipos de variáveis fundamentais (excluindo subtipos): Nominal (categórico / qualitativo), Ordinal e Contínuo (Numérico, Quantitativo). Ordinal tem natureza qualitativa e quantitativa.
O atributo não é realmente do tipo básico, mas geralmente é discutido dessa maneira ao escolher um gráfico de controle apropriado, onde se escolhe o melhor pdf com o qual modelar o sistema. Isso às vezes é chamado de "dados de atributo", mas seu tipo é nominal (também conhecido como categórico, etc.). Como Nick mencionou, contamos nominais, para que possa ser confundido com um tipo numérico, mas não é.
fonte
Encontrei essa pergunta ao pesquisar sobre níveis de medição e conceitos relacionados. Eu acho que os gráficos da questão não têm o contexto. Quando fazemos a categorização, definimos as regras para agrupar os objetos de acordo com nosso objetivo. Então qual é o propósito? E nós estamos falando sobre as variáveis?
Poderíamos categorizar as variáveis de acordo com os níveis de medida , e poderíamos ter 4 escalas (grupos) com as seguintes regras:
nominal : os atributos de uma variável são diferenciados apenas pelo nome (categoria) e não há ordem (classificação, posição).
ordinal : os atributos de uma variável são diferenciados por ordem (posição, posição), mas não sabemos o grau relativo de diferença entre elas.
intervalo : os atributos de uma variável são diferenciados pelo grau de diferença entre eles, mas não há zero absoluto e a proporção entre os atributos é desconhecida.
ratio : os atributos de uma variável são diferenciados pelo grau de diferença entre elas, existe um zero absoluto e podemos encontrar a razão entre os atributos.
E esta é apenas uma abordagem de Stanley Smith Stevens. Existem várias outras tipologias.
Variáveis contínuas e discretas são conceitos matemáticos, onde temos uma variedade de números reais e:
variável contínua pode assumir qualquer valor nesse intervalo. O número de valores permitidos é incontável.
enquanto que para variáveis discretas o número de valores permitidos no intervalo é finito ou infinitamente contável.
fonte