Qual a diferença entre estatística e informática?

10

Sempre dizemos que as estatísticas estão apenas lidando com dados. Mas também sabemos que a informática também está obtendo conhecimento da análise de dados. Por exemplo, o pessoal de bioinformática pode ficar totalmente sem bioestatística. Quero saber qual é a diferença essencial entre estatística e informática.

Honglang Wang
fonte
7
Não, isso é apenas porque a palavra "informática" perdeu completamente o significado definitivo. "Bioinformática" foi cunhada apenas para "biologia feita no computador", não há nada profundo nisso.
11
@mbq Concordou. "Informática" e "Bioinformática" perderam qualquer definição significativa.
fomite
em bioinformática forma clara (aplicar suas descobertas para observar os resultados em forma biológica)
Kamal Alblwei

Respostas:

20

Excelente pergunta !!

Ouvi várias vezes que os bioinformáticos podem ficar sem bioestatística ou mesmo sem estatísticas. Isso é perfeitamente verdade até que se torne falso. Na minha opinião, a falta geral de conhecimento estatístico tem um efeito desastroso no campo, como mostra Keith Baggerly . Também pude observar que a falta de conhecimento básico em estatística (e álgebra linear) é a causa da estagnação dos bioinformáticos a longo prazo: sem um conhecimento profundo da teoria, eles tendem a reinventar a roda e recorrer a soluções ad hoc que resolvem nada além de seu próprio problema.

Mas agora, para responder à sua pergunta, concordo que, em geral, as estatísticas não podem ficar sem computadores naqueles dias. No entanto, um dos principais aspectos da estatística é a inferência , que não tem nada a ver com computadores. A inferência estatística é, na verdade, o que faz da estatística uma ciência, porque diz se suas conclusões são válidas ou não em outros contextos.

Em resumo, você pode analisar seus dados de maneira infernal; ainda precisará de estatísticas para saber a validade das previsões ou decisões que você tomará com base em suas análises.

gui11aume
fonte
Obrigado. Você poderia explicar mais sobre qual é o princípio geral por trás da bioinformática para torná-la uma disciplina. Para as estatísticas, de um modo geral, existem duas partes principais, uma é a manipulação pura de dados, a outra é a inferência estatística, que se baseia na probabilidade, uma das matemáticas puras. Com base nos modelos estatísticos (modelos de probabilidade), as pessoas de estatística podem fazer ciência. E a bioinformática?
Honglang Wang
4
Bioinformática é simplesmente o uso de computadores para estudar questões biológicas. As disciplinas são geralmente definidas pelas perguntas que fazem, não por seus métodos; portanto, a bioinformática deve fazer parte da biologia na minha opinião. Ele tem um nome especial porque os biólogos são muito ruins com os computadores; portanto, as pessoas que podem fazê-lo devem ter um rótulo especial. Não tenho certeza de que em 50 anos, quando os biólogos forem melhores em TI e matemática, a bioinformática ainda existirá.
precisa saber é o seguinte
2
É bom ver alguém apreciando os esforços de Keith. Ele certamente não se esquivou da controvérsia ou de situações profissionais difíceis e desconfortáveis.
cardeal
O cardeal Saw Keith falou em uma conferência da APHA há um ou dois anos. Foi uma das melhores palestras que eu já vi.
fomite
9

Minha opinião é que, embora exista uma justa quantidade de sobreposições entre os campos, também existem diferenças importantes. Em geral, um estudante de estatística (nos graus mais altos) terá mais aulas teóricas (matemática e matemática) do que o aluno de informática, mas o aluno de informática aprenderá mais sobre o lado da computação (especialmente a parte do banco de dados).

O desenvolvimento de um novo teste estatístico cairia mais para o estatístico do que para o informatista, mas projetar uma interface para um usuário inserir dados e produzir tabelas e gráficos caía mais para o informático do que para o estatístico.

Para o estatístico, o computador é uma ferramenta para ajudar nas estatísticas. Para o informático, as estatísticas são uma ferramenta para ajudar a coletar e distribuir informações (geralmente via computador).

Edite abaixo aqui -----

Para exand, aqui está um exemplo. Eu trabalhei em projetos com informáticos (eu sou o estatístico) em que um médico quer ter um sistema em que as informações dos pacientes sejam usadas para prever seu risco de alguma condição (desenvolver um coágulo sanguíneo, por exemplo) e desejar receber alguma forma de alerta para que eles saibam sobre o risco. Meu papel no projeto (o papel estatístico) é desenvolver um modelo que preveja o risco, dadas as variáveis ​​preditoras (um modelo de regressão logística é um desses modelos). O papel do informático no projeto é desenvolver as ferramentas que coletam as variáveis ​​preditoras, usar meu modelo nelas e enviar os resultados ao médico. Os dados podem ser coletados a partir de um prontuário eletrônico, ou através de uma tela de entrada de dados para que uma enfermeira preencha ou outros.

Agora eu (e muitos outros estatísticos) conheço o suficiente da programação que poderia consultar um banco de dados para obter os preditores e criar algum tipo de alerta, mas estou feliz em deixar isso para os informáticos (e eles são melhores nisso de qualquer maneira). Existem informatistas que conhecem estatísticas suficientes para se ajustarem ao modelo de regressão logística. Portanto, uma versão simples deste projeto pode ser feita apenas por um estatístico, ou apenas um informático, mas é melhor quando ambos trabalham juntos. Se você olhar para este projeto e achar que a parte de modelagem é a parte divertida e a coleta de dados, o alerta e outras interfaces são apenas ferramentas para mover as informações de e para o modelo, então você é mais estatístico. Se você vir projetando a interface, otimizando a recuperação de dados, testando diferentes tipos de alertas etc.

Greg Snow
fonte
(+1) Gosto do saldo desta resposta. Não sei se entendi bem o que se pretendia com a última frase.
cardeal
11
Eu acho que o seu exemplo é muito bom e dá um bom retrato da configuração básica da terra. Eu gostaria de poder votar novamente por essa parte. Felicidades.
cardeal
Seu exemplo é muito legal. Muito obrigado. Agora estou apenas pensando em uma pergunta. Para o estatístico, se todo o modelo estatístico deve ter parte de inferência, como intervalo de confiança ou teste de hipóteses, e, portanto, com base em modelos de probabilidade? Caso contrário, eles apenas manipularão o conjunto de dados plotando e resumindo.
Honglang Wang
9

Estatísticas inferem de dados; Informática opera com dados. É claro que eles se sobrepõem, mas a questão de qual é o escopo maior não tem resposta.

stackovergio
fonte
"A estatística deduz dos dados; a informática opera com dados". É isso mesmo que quero confirmar. Para a inferência, sempre baseada na distribuição de probabilidade, deve incluir intervalo de confiança ou teste de hipóteses. Caso contrário, você está apenas operando com dados.
Honglang Wang