No livro Modelos Estatísticos e Métodos para Dados da Vida , está escrito:
Censura: Quando uma observação é incompleta devido a alguma causa aleatória.
Truncamento: quando a natureza incompleta da observação se deve a um processo de seleção sistemático inerente ao desenho do estudo.
O que se entende por "processo de seleção sistemático inerente ao desenho do estudo" na definição de truncamento?
Qual é a diferença entre censura e truncamento?
Respostas:
Censura : algumas observações serão censuradas, o que significa que sabemos apenas que elas estão abaixo (ou acima) de alguma ligação. Isso pode ocorrer, por exemplo, se medirmos a concentração de um produto químico em uma amostra de água. Se a concentração for muito baixa, o equipamento de laboratório não poderá detectar a presença do produto químico. Ainda pode estar presente, portanto, sabemos apenas que a concentração está abaixo do limite de detecção do laboratório.
Truncamento : o processo que gera os dados é tal que só é possível observar resultados acima (ou abaixo) do limite de truncamento. Isso pode, por exemplo, ocorrer se as medições forem realizadas usando um detector que somente será ativado se os sinais detectados estiverem acima de um determinado limite. Pode haver muitos sinais de entrada fracos, mas nunca podemos dizer usando este detector.
fonte
Assim como uma perspectiva de outro campo (programação), censurar e truncar são duas operações distintas.
Ao trabalhar com um conjunto de dados sensíveis, para os números de segurança social exemplo e números de telefone, eu poderia censurar -lo ou tê-lo censurado antes de o acesso ser concedido:
Isso permite que o restante do aplicativo opere normalmente, com estruturas de dados semelhantes, mas sem conteúdo informativo real ou disseminação de informações privadas.
O truncamento, por outro lado, normalmente está apenas cortando os valores restantes após um certo ponto. Para trabalhar em um aplicativo, não preciso de centenas de milhares de registros, talvez precise apenas de 50 de cada um, o que torna o acesso aos dados muito mais rápido e os conjuntos de dados menores.
Uma variante semelhante de truncamento ocorre ao inserir um valor em uma coluna ou tipo de dados de comprimento ou precisão limitados:
fonte