É nominal, ordinal e binário para dados quantitativos, dados qualitativos ou ambos?

9

Estou me envolvendo com os tipos de dados e preciso de ajuda:

insira a descrição da imagem aqui

Se você olhar a figura acima (tirada daqui ), ela tem os tipos de dados como este:

  • Quantitativo (Discreto, Contínuo)
  • Qualitativo (Nominal (N), Ordinal (O), Binário (B)).

insira a descrição da imagem aqui

Mas se você olhar para a próxima foto ( daqui ), as categorias são:

  • Quantitativo (Discreto (NOB))
  • Qualitativa

Uma imagem possui NOB sob Qualitativa, a outra possui Quantitativa. Qual deles está correto?

Inclinando-se
fonte
5
Cada marcador na descrição de "dados discretos" é errado e enganoso.
whuber

Respostas:

5

Essas tipologias podem facilmente confundir tanto quanto explicam.

Por exemplo, dados binários, como introduzido em muitos textos ou cursos introdutórios, certamente soa qualitativo: sim ou não, sobreviveu ou morreu, presente ou ausente, homem ou mulher, qualquer que seja. Mas marque as duas possibilidades 1 ou 0 e tudo será perfeitamente quantitativo. Essa pontuação é a base de todos os tipos de análises: a proporção de mulheres é apenas a média de vários 0s para homens e 1s para mulheres. Se eu encontrar 7 mulheres e 3 homens, posso calcular em média 1, 1, 1, 1, 1, 1, 1, 0, 0, 0 para obter a proporção 0,7. Com as respostas binárias, você tem um amplo caminho aberto para logitar e probitar a regressão, e assim por diante, que se concentram na variação na proporção, fração ou probabilidade sobrevivida, ou algo semelhante, com o que mais a controla ou influencia. Ninguém precisa se preocupar com a codificação ser arbitrária. A proporção masculina é apenas 1 menos a proporção feminina,

Quase o mesmo acontece quando dados nominais ou ordinais estão sendo considerados, pois qualquer análise desses dados depende da primeira contagem de quantos se enquadram em cada categoria e você pode ser quantitativo quanto desejar. Os gráficos de pizza e de barras, como encontrados pela primeira vez nos primeiros anos, mostram que, portanto, é intrigante quantas contas perdem isso nas explicações.

Dito de outra forma, você pode classificar os dados brutos ou originais como relatados pela primeira vez e como aparecem na célula de uma planilha ou banco de dados. Mas sua forma original não é imutável. Imagine algo severo como uma morte de perplexidade por ler muitos livros superficiais. Isso pode ser escrito em um certificado, mas a análise estatística nunca pára por aí. Há uma agregação de contagens (quantas dessas mortes em uma área e um período), uma redução nas taxas (quantas em relação à população em risco) e assim por diante.

Portanto, como os dados são codificados pela primeira vez raramente inibe seu uso de outras formas e a transformação para outras formas. A etimologia dos dados é aqui reveladora: traduzindo o latim original literalmente, eles são dados a você, mas não há regra contra convertê-los para muitas outras formas.

Nick Cox
fonte
5

Não consegui encontrar uma imagem que reunisse tudo, então criei uma com base no que tenho estudado. Colocar as escalas de medida no mesmo diagrama com os tipos de dados estava me confundindo, então tentei mostrar que há uma distinção lá.

insira a descrição da imagem aqui

Agradeço sua ajuda e pensamentos! Atenciosamente, Inclinado

Inclinando-se
fonte
Variáveis ​​quantitativas discretas (contagens semelhantes) também podem ser medidas usando escala de intervalo ou razão! Veja aqui , por exemplo.
Rodvi
3

Depende do que você quer dizer com "dados quantitativos" e "dados qualitativos".

Acho que os dois sites citados estão usando os termos de maneira diferente. Suponha, por exemplo, que você pergunte às pessoas:

Did you vote for Obama, Romney, someone else or no one in the presidential election?

Que tipo de dados são esses? A variável é nominal: são apenas nomes, não há ordem para isso. Mas muitas pessoas chamariam isso de quantitativo, porque o principal é quantas escolhem qual candidato. Isso é o contrário de dados qualitativos, que podem ser transcrições de entrevistas sobre o que eles mais gostam em Obama (ou Romney ou quem quer que seja).

Uma maneira melhor de analisar isso é distinguir claramente os dados quantitativos das variáveis ​​quantitativas.

Peter Flom
fonte
No primeiro caso, há uma variável que possui o nome de presidente. A variável é qualitativa, para ser preciso é nominal. No segundo caso, todo nome de presidente corresponde a uma variável individual, que mantém os eleitores. Se nomes de eleitores são conhecidos e, contém nomes de eleitores, a variável é nominal. Se possuir número de votos, a variável é quantitativa, para ser mais preciso, está na escala de proporções.
Ioannis Iliadis - Ilousis 8/03
2

Nenhum desses gráficos está correto. Eles são um tanto absurdos e você tem razão em ficar confuso (além da contradição).

Eles parecem conflitar as idéias do tipo de variável fundamental e seleção de variáveis ​​para modelar um sistema (com um pdf).

Existem 3 tipos de variáveis ​​fundamentais (excluindo subtipos): Nominal (categórico / qualitativo), Ordinal e Contínuo (Numérico, Quantitativo). Ordinal tem natureza qualitativa e quantitativa.

O atributo não é realmente do tipo básico, mas geralmente é discutido dessa maneira ao escolher um gráfico de controle apropriado, onde se escolhe o melhor pdf com o qual modelar o sistema. Isso às vezes é chamado de "dados de atributo", mas seu tipo é nominal (também conhecido como categórico, etc.). Como Nick mencionou, contamos nominais, para que possa ser confundido com um tipo numérico, mas não é.

mandata
fonte
1
Mandata, com base no que você está dizendo, que mudanças você faria no gráfico que fiz acima? eu aprecio sua ajuda. Atenciosamente, inclinando-se
inclinando-se
Mandata, todos esses gráficos de diferentes especialistas estão parcialmente corretos. O fato é que as pessoas entendem as palavras e os conceitos de maneira não idêntica, mas preferem, por algum tempo, longo ou curto, acumular-se em seu próprio entendimento confortável. Por exemplo, algumas pessoas rejeitam chamar a escala ordinal de "quantitativa", enquanto outras aceitam, dependendo se "quantidade" é necessariamente manifesta de uma categoria de ser potencialmente subjacente.
precisa saber é
@Leaning. Esse gráfico é melhor que o seu último. Eu consideraria discreta uma qualidade de tipo, não um tipo em si. Nominal e ordenado são totalmente discretos, enquanto quantitativo contável (finito ou infinito) também é. Binário também é uma característica do tipo (é um subconjunto de discreto). O binário raramente é ordenado e quase sempre é representado por variáveis ​​nominais. Categórico e nominal são sinônimos. A diferença entre variáveis ​​ordenadas dificilmente faz sentido, elas podem ser parcial ou totalmente desconhecidas ou não relevantes (a última implica falta de sentido), mas eu não afirmaria isso.
mandata
@ttnphns, concordo com o que você está dizendo em espírito, mas ambos têm sérios erros conceituais. o primeiro combina a ideia do tipo de dado do atributo, usado na seleção de um gráfico de controle, que tipo de dados básico. O segundo tem nominal como um subconjunto de discreto, que é um subconjunto de contínuo. Eu poderia subconjunto discreto, mas nominal pertence sob qualitativo. Talvez esteja lá porque se conta discretamente os eventos nominais, mas mesmo que seja por isso que está incorreto.
#
Não acho que a teoria do intervalo / razão seja uma maneira válida de descrever o tipo de variável. Pode ser bom determinar quais funções são razoáveis ​​quando alguém não se sente confiante com relação à matemática, mas além disso, vejo uma escala como uma transformação de outra escala, se elas representam as mesmas dimensões ou unidades.
mandata
1

Encontrei essa pergunta ao pesquisar sobre níveis de medição e conceitos relacionados. Eu acho que os gráficos da questão não têm o contexto. Quando fazemos a categorização, definimos as regras para agrupar os objetos de acordo com nosso objetivo. Então qual é o propósito? E nós estamos falando sobre as variáveis?

Poderíamos categorizar as variáveis ​​de acordo com os níveis de medida , e poderíamos ter 4 escalas (grupos) com as seguintes regras:

nominal : os atributos de uma variável são diferenciados apenas pelo nome (categoria) e não há ordem (classificação, posição).
ordinal : os atributos de uma variável são diferenciados por ordem (posição, posição), mas não sabemos o grau relativo de diferença entre elas.
intervalo : os atributos de uma variável são diferenciados pelo grau de diferença entre eles, mas não há zero absoluto e a proporção entre os atributos é desconhecida.
ratio : os atributos de uma variável são diferenciados pelo grau de diferença entre elas, existe um zero absoluto e podemos encontrar a razão entre os atributos.

E esta é apenas uma abordagem de Stanley Smith Stevens. Existem várias outras tipologias.

Variáveis ​​contínuas e discretas são conceitos matemáticos, onde temos uma variedade de números reais e:

variável contínua pode assumir qualquer valor nesse intervalo. O número de valores permitidos é incontável.
enquanto que para variáveis ​​discretas o número de valores permitidos no intervalo é finito ou infinitamente contável.

wombatonfire
fonte