É errado reformular "1 em 80 mortes é causada por um acidente de carro", pois "1 em cada 80 pessoas morrem como resultado de um acidente de carro?"

56
  • Declaração 1 (S1): "Uma em cada 80 mortes é causada por um acidente de carro".
  • Declaração Dois (S2): "Uma em cada 80 pessoas morre como resultado de um acidente de carro".

Agora, pessoalmente, não vejo muita diferença entre essas duas afirmações. Ao escrever, eu os consideraria intercambiáveis ​​para um público leigo. No entanto, fui desafiado por duas pessoas agora e estou procurando alguma perspectiva adicional.

Minha interpretação padrão de S2 é: "Das 80 pessoas sorteadas aleatoriamente da população de seres humanos, esperamos que uma delas morra como resultado de um acidente de carro" - e considero essa declaração qualificada equivalente a S1.

Minhas perguntas são as seguintes:

  • Q1) Minha interpretação padrão é realmente equivalente à Declaração Um?

  • Q2) É incomum ou imprudente que essa seja minha interpretação padrão?

  • Q3) Se você acha S1 e S2 diferente, de modo a indicar o segundo quando um significa que o primeiro é enganoso / incorreto, você poderia fornecer uma revisão totalmente qualificada do S2 equivalente?

Vamos deixar de lado a queixa óbvia de que S1 não se refere especificamente a mortes humanas e supor que isso seja entendido no contexto. Também deixemos de lado qualquer discussão sobre a veracidade da alegação: ela deve ser ilustrativa.

Tanto quanto posso dizer, as divergências que ouvi até agora parecem centrar-se na falta de interpretações diferentes da primeira e da segunda afirmações.

Pela primeira vez, meus desafiantes parecem interpretá-lo como 1/80 * num_deaths = número de mortes causadas por acidentes de carro, mas, por algum motivo, o padrão é uma interpretação diferente do segundo na linha de "se você tiver algum conjunto para 80 pessoas, um deles vai morrer em um acidente de carro"(que obviamente não é uma reclamação equivalente). Eu acho que, dada sua interpretação de S1, seu padrão para S2 seria lê-lo como (1/80 * num_dead_people = número de pessoas que morreram em um acidente de carro == número de mortes causadas por acidente de carro). Não sei por que a discrepância na interpretação (o padrão para S2 é uma suposição muito mais forte) ou se eles têm algum senso estatístico inato de que realmente estou com falta.

faulty_ram_sticks
fonte
19
"se você tiver 80 pessoas, uma delas morrerá em um acidente de carro" - se é assim que elas entendem essa afirmação, então eu tenho uma piada extremamente antiga: uma em cada três crianças é chinesa por ser absolutamente indo amar .
Steve Jessop
3
Isso é muito semelhante à diferença entre prevalência e incidência . Como outros observaram, "é causado" refere-se a algum estado acabado e "morre" refere-se ao presente ou futuro.
Sextus Empiricus
5
S2 não deixa claro que os outros 79 morreram. Alguns ou todos os outros 79 poderiam estar vivos. S1 diz "1 em cada 80 mortes", o que deixa claro que todas as 80 pessoas do grupo morreram.
Michael Chernick
5
Como leigo, sem conhecer o contexto, eu interpretaria S1 como: "de todas as causas de morte para a população X, 1/80 é devido a acidentes de carro", enquanto S2 me lê: "de todas as pessoas envolvidas em acidentes de carro, 1 em cada 80 morre devido a isso ".
Gnudiff 23/01
5
(S2): "Uma em cada 80 pessoas morre como resultado de um acidente de carro." parece ambíguo para mim. É uma em cada 80 pessoas que sofrem acidentes de carro ou uma em cada 80 pessoas?
Bill the Lizard

Respostas:

67

Primeiro de tudo, meu primeiro pensamento intuitivo foi: "S2 só pode ser o mesmo que S1 se a taxa de mortalidade no trânsito permanecer constante, possivelmente ao longo de décadas" - o que certamente não teria sido uma boa suposição nas últimas décadas. Isso já sugere que uma dificuldade está em suposições temporais implícitas / não ditas.

Eu diria que suas declarações têm a forma

1 em experiência da .x populationevent

Em S1, a população é de mortes, e a especificação temporal implícita é atualmente ou "em um número suficientemente grande [para ter números de casos suficientes], mas não em um período de tempo muito amplo [para ter características de acidentes de carro aproximadamente constantes] ao redor do presente"

No S2, a população é de pessoas. E outros parecem ler isso não como "pessoas moribundas", mas como "pessoas vivas" (que, afinal, é o que as pessoas fazem com mais frequência / mais tempo). Se você lê a população como pessoas vivas, claramente, nenhuma em cada 80 pessoas que vivem agora morre "agora" de um acidente de carro. Então isso é lido como "quando eles estão morrendo [possivelmente daqui a algumas décadas], a causa da morte é um acidente de carro".

Leve a mensagem para casa: sempre tenha cuidado para explicar quem é sua população e o denominador das frações em geral. (Gerd Gigerenzer tem artigos sobre não escrever o denominador como uma das principais causas de confusão, principalmente em estatísticas e comunicação de riscos).

cbeleites suporta Monica
fonte
11
"Em S1, a população é de mortes, e a especificação temporal implícita é atualmente ou" em um número suficientemente grande [para ter números de casos suficientes], mas não muito longo [para ter características aproximadamente constantes de acidentes de carro] em torno do presente "- Ao considerar todas as (maravilhosas) respostas que recebi, acho que isso corta o cerne da questão.Fiquei duplamente surpreso com a enorme variedade de maneiras pelas quais as pessoas podem fazer a segunda declaração, e muitas abriram meu olhos para essas interpretações, mas esta é a especificação estatística que faltava na minha declaração original
faulty_ram_sticks 25/01
faulty_ram_sticks: Obrigado pelas flores :-) E essas duas especificações de população possíveis que eu fiz do S2 não são de longe as únicas, por exemplo, você pode especificar, ao longo das linhas da resposta do @ PeterShor, uma população de pessoas nascidas em algum período de tempo e seguir isso um (longitudinalmente). E assim por diante.
cbeleites apoia Monica em 25/01
@cbeleites flowers? que flores? : - /
The Great Duck
11
Posso também apontar que o uso de "mortes é causado" e "pessoas morrem " também é confuso / ruim. Sinto que, ao descrever uma estatística, deve ser "mortes foram causadas" e "pessoas morreram". Isso torna inequívoco o fato de você estar descrevendo um evento passado em vez de fazer uma previsão. É claro que também se poderia dizer que "as pessoas vão morrer" para dizer que a estatística fornece credibilidade para a previsão de que uma certa porcentagem da população atual morrerá por acidentes de carro. Dou esses exemplos aqui para referência futura, pois eles não são uma resposta por si só.
The Great Duck
Mas dizer que uma porcentagem de mortes é causada me confunde, porque isso descreve o presente como se o evento estivesse ocorrendo agora ou algo assim. Se eu visse isso, consideraria a redação ruim, mas provavelmente não leria muito. No entanto, como essa é uma discussão sobre a redação, achei que deveria trazê-la à tona.
The Great Duck
80

Para mim, "1 em 80 mortes ..." é de longe a afirmação mais clara. O denominador no seu "1 em 80" é o conjunto de todos os eventos de morte e essa declaração o torna explícito.

Há ambiguidade na formulação "1 em 80 pessoas ...". Você realmente quer dizer "1 em cada 80 pessoas que morrem ...", mas a afirmação pode ser tão facilmente interpretada como "1 em cada 80 pessoas que estão vivas agora ..." ou similar.

Sou a favor de ser explícito sobre o conjunto de referências em asserções de probabilidade ou frequência como esta. Se você está falando sobre a proporção de mortes, diga "mortes" e não "pessoas".

Brent Hutto
fonte
31
"" 1 em cada 80 pessoas que morrem ... "- dado que não existe imortalidade, podemos assumir com segurança que o conjunto de pessoas que morrerão é o mesmo que todas as pessoas. Você precisaria de um qualificador adicional, por exemplo "pessoas que morrerão no próximo ano "
MSalters
16
@Msalters As declarações estão no tempo presente, portanto, afirmam uma reivindicação sobre a taxa atual.
Acumulação 22/01
6
Tecnicamente, acho que "1 em 80 pessoas" é mais específica, porque há muito mais mortes do que pessoas: mortes de pássaros, mortes de bactérias, mortes de pediatria, ...
Kimball
2
@Pere: Eu não entendo direito, você está dizendo a mesma coisa de quando eu disse the 1/80 ratio does focus on the present time in particular. Ou estou entendendo mal?
Flater 23/01
3
(Na nota de uma possível ambiguidade) Do ponto de vista da língua inglesa; Eu acho que um mal-entendido mais comum (e mais sério) seria ler S2 como "1 em 80 pessoas que sofreram um acidente de carro, morrerão nesse acidente" (ou seja, "1 em cada 80 acidentes de carro são fatais") - o que é uma reivindicação muito diferente.
Bilkokuya 23/01
43

Depende se você está descrevendo ou prevendo .

"1 em cada 80 pessoas morrerão em um acidente de carro" é uma previsão. De todas as pessoas que vivem hoje, em algum momento da vida restante, uma em cada 80 pessoas morrerá assim.

"1 em 80 mortes são causadas por um acidente de carro" é uma descrição. De todas as pessoas que morreram em um determinado período (por exemplo, o período de um estudo de apoio), 1 em cada 80 delas realmente morreu em um acidente de carro.

Observe que a janela de tempo aqui é ambígua. Uma frase implica que as mortes já ocorreram; o outro implica que eles ocorrerão algum dia. Uma frase implica que a população da linha de base são pessoas que morreram (e que estavam vivas antes disso); o outro implica uma população básica de pessoas que estão vivas hoje (e morrerão eventualmente).

Na verdade, são declarações totalmente diferentes e apenas uma delas provavelmente é suportada pelos dados de origem.

Em uma nota lateral, a ambiguidade surge de uma incompatibilidade entre o estado de ser uma pessoa (que acontece continuamente) e o evento de morte (que acontece em um determinado momento). Sempre que você combina as coisas dessa maneira, obtém algo igualmente ambíguo. Você pode resolver instantaneamente a ambiguidade usando dois eventos em vez de um estado e um evento; por exemplo, "de cada 80 pessoas que nascem, 1 morre em um acidente de carro".

John Wu
fonte
11
Além de ser uma previsão, poderia estranhamente ser interpretada como uma ameaça. A leitura desta resposta me fez pensar no xkcd relevante .
Wildcard
3
"Hoje, uma em cada 80 mortes é causada por um acidente de carro. Mas, dada a rápida melhoria na tecnologia de veículos e estradas e a mudança gradual para outros modos de transporte, esperamos que caia para uma em 120 no ano de 2050, e uma em 150 até 2100. Por conseguinte, das pessoas que vivem hoje, apenas uma em 135 morrerá em um acidente de carro ".
Michael Kay
21

As duas declarações são diferentes devido ao viés de amostragem, porque os acidentes de carro são mais prováveis ​​de ocorrer quando as pessoas são jovens.

Vamos tornar isso mais concreto, colocando um cenário irreal.

Considere as duas instruções:

  • Metade de todas as mortes são causadas por um acidente de carro.
  • Metade de todas as pessoas vivas hoje morrerão em um acidente de carro.

Mostraremos que essas duas declarações não são as mesmas.

Vamos simplificar bastante as coisas e supor que todos os nascidos morrerão de um ataque cardíaco aos 80 anos ou de um acidente de carro aos 40 anos. Além disso, vamos supor que a primeira afirmação acima seja válida e que estamos em uma população em estado estacionário. mortes equilibrar nascimentos. Depois, haverá três populações de seres humanos, todas igualmente grandes.

  • Pessoas com menos de 40 anos que morrerão de um acidente de carro.
  • Pessoas com menos de 40 anos que morrerão de ataque cardíaco.
  • Pessoas com mais de 40 anos que morrerão de ataque cardíaco.

Essas três populações devem ser igualmente grandes, porque a taxa de pessoas que morrem em acidentes de carro (da primeira população acima) e a taxa de pessoas que morrem em ataques cardíacos (da terceira população acima) são iguais.

1/401/40

Portanto, neste caso, apenas um terço de todas as pessoas vivas hoje morrerão em um acidente de carro; portanto, as duas declarações não são as mesmas.

Na vida real, minha impressão é que os acidentes de carro ocorrem em idades significativamente mais jovens do que a maioria das outras causas de morte. Se for esse o caso, haverá uma diferença substancial entre os números em sua declaração um e dois.

Se você modificou a segunda instrução para

  • Metade de todas as pessoas nascidas morrerão em um acidente de carro,

então, sob a suposição de uma população em estado estacionário, as duas declarações seriam equivalentes. Mas é claro que, no mundo real, não temos uma população em estado estacionário, e um argumento semelhante (embora mais complicado) mostra que, para uma população em crescimento ou encolhendo, o viés de amostragem ainda torna essas duas afirmações diferentes.

Peter Shor
fonte
"Essas três populações devem ser igualmente grandes, porque a taxa de pessoas que morrem em ataques cardíacos (da primeira população acima) e a taxa de pessoas que morrem em ataques cardíacos (da terceira população acima) são iguais". Você acha que poderia tornar isso um pouco mais óbvio? (Além disso, presumo que você queira dizer acidentes de carro para a primeira população). Caso contrário, este é um ótimo exemplo. Eu nem tinha considerado que poderia haver uma diferença entre "metade de todas as pessoas nascidas" e "metade de todas as pessoas vivas".
faulty_ram_sticks 23/01
@faulty_ram_sticks. Sim: o viés de amostragem pode ser complicado. Eu expliquei isso com mais detalhes ... Espero que isso seja bom o suficiente agora. E obrigado por pegar meu erro de digitação.
Peter Shor
5
Esta é uma maravilhosa questão de viés de amostragem. O fato de as 8 primeiras respostas não terem captado o viés de amostragem mostra que isso é realmente complicado. Eu posso usá-lo quando ensino probabilidade.
Peter Shor
Argumento muito bem construído, claro, e aquele que não apenas invalida teoricamente a intuição de equivalência do OP de uma maneira que ele provavelmente nem pensou.
Peter - Restabelece Monica
12

Minha interpretação padrão é de fato equivalente à Declaração Um?

Não.

Digamos que temos 800 pessoas. 400 morreram: 5 de um acidente de carro, os outros 395 esqueceram de respirar. S1 agora é verdadeiro: 5/400 = 1/80. S2 é falso: 5/800! = 1/80.

O problema é que tecnicamente S2 é ambíguo porque não especifica quantas mortes houve no total, enquanto S1 sim. Como alternativa, o S1 tem mais uma informação (total de mortes) e menos uma informação (total de pessoas). Tomados pelo valor nominal, eles descrevem diferentes proporções.

É incomum ou imprudente que essa seja minha interpretação padrão?

Na verdade, eu discordo de sua interpretação, mas acho que isso não importa. Provavelmente, o contexto tornaria óbvio o que se entende.

  • Por um lado, obviamente todas as pessoas morrem, portanto está implícito que o total de pessoas = total de mortes. Portanto, se você estiver discutindo taxas de mortalidade em geral, sua interpretação padrão será aplicada.
  • Por outro lado, se você estiver discutindo um conjunto de dados limitado no qual não é certo que todo mundo morre, minha interpretação acima é mais precisa. Mas não parece difícil para o leitor ignorar isso.

Você pode perguntar onde poderia encontrar pessoas que não morrem. Por um lado, poderíamos estar trabalhando com um conjunto de dados estatísticos que rastreia apenas as pessoas por 5 anos; portanto, os que ainda estão vivos no final do estudo devem ser ignorados, pois não se sabe do que eles morrerão. Como alternativa, a causa da morte pode ser desconhecida; nesse caso, você não pode atribuí-la a carros ou não a carros.

Se você acha S1 e S2 diferente, de modo a indicar o segundo quando um significa que o primeiro é enganoso / incorreto, você poderia fornecer uma revisão totalmente qualificada do S2 que seja equivalente?

"Uma em cada 80 pessoas que morrem, o faz como resultado de um acidente de carro." o que equivale a reformular S1.

Cloons
fonte
yy
Mas isso foi apenas uma nota de rodapé. O que eu queria dizer é que essa resposta apenas observa uma questão semântica, mas está faltando a questão estatística que trata da situação em que a probabilidade de uma morte ser causada por um acidente de carro não é constante independentemente do tempo. Isso o torna diferente quando nos referimos a 'é causado' (o passado) e '(vai) morrer' (o presente ou o futuro).
Sextus Empiricus 22/01
"Causa da morte" é um termo médico-legal que leva um tempo latente para ser estabelecido clinicamente, para relatar e coletar. Só se pode declarar isso em retrospecto quando a probabilidade de falta de uma causa de morte é pequena, ou de outro modo é corrigida a falta de dados, por exemplo, incluindo relatórios atrasados ​​do período anterior. Portanto, uma declaração estatisticamente adequada soa algo como: "Na região de coleta de dados geográficos durante o período de tempo, as chances de morte atribuíveis a acidentes de carro foram estimadas em uma em 80 mortes".
Carl
7

Concordo que sua interpretação da segunda declaração é consistente com a primeira. Concordo também que é uma interpretação perfeitamente razoável da segunda afirmação. Dito isto, a segunda afirmação é muito mais ambígua.

A segunda declaração também pode ser interpretada como:

  • Dada uma amostra de indivíduos em um acidente de carro recente, 1/80 morreu.
  • Dada uma amostra populacional em geral, 1/80 morrerá por causa de fatores relacionados a um acidente de carro, alguns deles por conta própria, mas outros por suicídio, ferimentos, negligência médica, justiça de vigilante etc.
  • Extrapolar as tendências atuais de segurança indica que 1/80 das pessoas vivas hoje morrerão por causa de um acidente de carro.

A segunda e terceira interpretações acima podem ser próximas o suficiente para o público leigo, mas a primeira é bem substancialmente diferente.

Alex H.
fonte
2
A primeira interpretação "1/80 de todas as vítimas de um acidente de carro morre por causa do acidente" é como eu interpretei a segunda afirmação a princípio. Embora eu não ache que seja uma interpretação correta e seja mais como resultado da leitura superficial.
Sextus Empiricus
5

A diferença básica é que as duas afirmações se referem a diferentes populações humanas e a diferentes períodos de tempo.

"Uma em cada 80 mortes é causada por um acidente de carro" presumivelmente se refere à proporção de mortes em algum período de tempo bastante limitado (digamos, um ano). Como a proporção da população total de carros e o registro de segurança dos carros mudaram significativamente ao longo do tempo, a declaração não faz sentido, a menos que você indique a que intervalo de tempo se refere. (Como um exemplo ridículo, claramente estaria completamente errado para o ano de 1919, considerando o nível de propriedade e uso de carros na população total da época). Observe que a "proporção da população total que usa carros" acima é realmente um erro - deve ser "a proporção de pessoas que morrerão em um futuro próximo usando carros"

"Uma em cada 80 pessoas morre como resultado de um acidente de carro" presumivelmente se refere a todos os seres humanos que estão atualmente vivos em alguma região e a sua eventual causa de morte em algum momento futuro desconhecido. Como a prevalência e a segurança das viagens de carro quase certamente mudarão durante a vida (digamos, nos próximos 100 anos, para os recém-nascidos de hoje), essa é uma afirmação muito diferente da primeira.

alephzero
fonte
3

A1) Supondo que todos morram e assumindo o contexto de um período de tempo suficientemente pequeno em torno do qual as medidas foram tomadas, sim, sua interpretação de S2 corresponde a S1.

A2) Sim, sua interpretação de S2 é imprudente. S2 pode ser interpretado como "1 em 80 pessoas envolvidas em acidentes de carro morre", o que obviamente não é equivalente a S1. Portanto, o uso do S2 pode causar confusão.

Sua interpretação de 1 em 80 é razoável, no entanto, e a outra interpretação (1 em cada 80) é muito incomum. "1 em N de U é P" é uma abreviação muito comum para "dado um predicado, P e N amostras aleatórias, x, do universo U, o número esperado de amostras, de modo que P (x) seja verdadeiro aproximadamente igual a 1" .

A3) Se todas as pessoas morrerem, 1 em cada 80 morre como resultado de um acidente de carro.

Vaelus
fonte
Você não explica sua resposta para A1. No entanto, houve algumas respostas abordando outros problemas (dizendo não a A1). Você poderia explicar por que isso não está certo?
Sextus Empiricus
@MartijnWeterings A única resposta que diz não a A1 parece discordar com o argumento de que, durante um período finito de tempo, nem todos morrem nessesariana. Você acha que minha edição aborda isso?
Vaelus 23/01
Penso que a frase que não indica que os outros 79 morreram por outras causas é, portanto, ambígua. Portanto, é melhor afirmar o outro.
Michael Chernick 23/01
Vaelus, há outra razão para dizer "não" a A1. Esse motivo é que a fração de mortes por acidentes de carro pode não precisar ser constante no tempo, portanto é ambígua, e S1 e S2 têm uma perspectiva diferente em relação a essa expressão (não constante).
Sextus Empiricus 23/01
-1

Sim, está errado e nenhuma frase parece suficiente para transmitir consistentemente o significado desejado

Falando como leigo, se o seu alvo são leigos, eu recomendaria definitivamente postar em https://english.stackexchange.com/ , em vez de aqui - sua pergunta levou algumas leituras para desvendar o que S1 e S2 significam intuitivamente para mim vs. o que você quis dizer.

Para o registro, minhas interpretações de cada afirmação:

  • (S1) - por 80 mortes, 1 morte por acidente de carro

  • (S2) - por 80 pessoas em um acidente de carro, 1 morte

Para transmitir seu significado, eu provavelmente usaria um S2 modificado: "Uma em cada 80 pessoas morrerá em um acidente de carro".

Isso ainda contém alguma ambiguidade, mas mantém uma brevidade semelhante.

ap55
fonte
Este é um comentário e não uma resposta.
Michael Chernick 23/01
11
@ Michael Desculpe, como assim? Não estou pedindo esclarecimentos, nem apontando erros de digitação ou algo assim - informe-me se a edição ajudar.
ap55 23/01