Como computo adequadamente o tempo médio até a falha?

8

Tenho um produto do qual enviamos algo como 500 unidades nos últimos cinco anos. Este produto não deve ser reparado pelo usuário; uma falha de qualquer componente resulta na substituição da unidade. A maioria dessas unidades nunca viu problemas e ainda está funcionando bem. Alguns foram danificados e voltam para reparos.

Como eu calcularia o tempo médio até a falha (MTTF)? Incluiria apenas as unidades que falharam? Ou eu também figuraria em todas as unidades que estão atualmente em operação? E o fato de eu ter apenas a data da venda, não a data da instalação? E que eu não sei em que fração do tempo instalado a unidade está funcionando? Devo apenas fazer suposições razoáveis?

Stephen Collings
fonte
Qual é a precisão esperada do MTTF?
Mahendra Gunawardena
@MahendraGunawardena Não tenho idéia de como começaria a responder a essa pergunta, infelizmente.
Stephen Collings
É possível ir até os clientes e perguntar a eles que tipo de tempo de operação as unidades que eles compraram vêem? Mesmo que seja uma estimativa aproximada, imagino que isso lhe proporcionará uma melhor sensação de tempo de atividade do que você poderia obter apenas adivinhando por conta própria.
Trevor Archibald

Respostas:

5

Primeiro, lembre-se sempre de que lixo entra = lixo sai; portanto, se seus dados forem lixo, suas estatísticas serão lixo.

Nessa situação, seus dados ideais seriam algo como Horas de execução até falha e todo o conjunto de dados já teria falhado. Com isso em mente, convém escolher um número conservador a partir de qualquer estatística que você calcular.

Como você tem apenas uma falha a partir da data de venda, isso pode estar inclinado para um MTTF mais alto.

Como nem todo o seu produto falhou, você pode observar um subconjunto menor da sua população, digamos os primeiros seis meses de produção. Uma porcentagem maior delas falhou provavelmente (já que o produto que você vendeu na semana passada não deve falhar esta semana, espero).

Se a sua proporção de falha ainda for muito baixa, talvez você precise ajustar os dados a uma distrubuição, tendo em mente que você possui apenas a baixa proporção da distribuição, ou seja, você deve extrapolar do conjunto de dados para uma curva ajustada.

Por exemplo, a Distribuição Weibull funcionaria bem aqui e é comumente usada para dados MTTF. A idéia aqui é ajustar a proporção do seu conjunto de dados que falhou na proporção correspondente de uma distribuição. Se sua proporção de produtos em seu conjunto de dados que falhou foi de 48,66%, você ajustaria essa probabilidade à sua distribuição hipotética, conforme mostrado pela área sombreada na imagem a seguir.

PDF

Isso pode ser bastante intenso, no entanto, para qualquer coisa além de uma distribuição exponencial.

Outro método de extrapolação é por Análise de Degradação

Acumen Simulator
fonte
4

Se você não possui dados concretos, fazer suposições (de preferência "razoáveis") é a única opção que você tem. (Talvez seja por isso que os engenheiros costumavam chamar suas regras de slide de "palitos de adivinhação ...")

Você não pode ignorar o fato de que a maioria das unidades não falhou até o momento. Uma abordagem plausível para isso seria usar o tempo até a falha que você conhece, para ajustar os parâmetros do modelo estatístico do processo de falha. Você também precisa verificar se as previsões do modelo são consistentes com os dados brutos, antes de usá-lo para prever qualquer coisa.

Um modelo comumente usado em engenharia de confiabilidade é a distribuição Weibull, que pode representar uma ampla gama de diferentes "causas-raiz" de falha e será ajustada automaticamente para usar a "melhor" forma da curva de probabilidade (dentro dos limites, é claro) para combine seus dados do mundo real.

O Google encontrará muitos acessos para o "tutorial de distribuição Weibull" etc., mas se você é novo nisso, seria uma boa idéia obter uma visão geral da "engenharia de confiabilidade" antes de entrar em detalhes. Um bom lugar para começar seria uma organização profissional de engenharia, por exemplo, a American Society for Quality (ASQ) .

A maneira mais prática de fazer a estimativa seria usar algum software de computador, em vez de descobrir como fazer as contas manualmente, mas sem mais detalhes do problema, é difícil recomendar qualquer pacote em particular.

alephzero
fonte
Seu comentário sobre como garantir que as previsões sejam consistentes com os dados brutos foi direto! Montamos uma planilha de distribuição Weibull. Do conjunto muito limitado de falhas até agora, nosso MTTF ficou em torno de seis meses, com uma taxa de falha esperada de 99% em cinco anos. Isso é completamente inconsistente com a realidade. Então isso levanta a questão ... e agora?
Stephen Collings
2

A ferramenta estatística Weibull, conforme sugerido pelas duas respostas anteriores, é a ferramenta de escolha para os cálculos do tempo médio até a falha (MTTF) . Com base no seu comentário como captura abaixo, parece que a Análise Weibull não gerou os resultados esperados.

Comentário de Stephen Collings

A maioria dos estatísticos com quem trabalhei recomenda um tamanho de amostra de 30 para a maioria das análises estatísticas. Minha suspeita é que o tamanho limitado dos dados possa não estar ajudando na análise. Sugiro começar com um cálculo simples de média e desvio padrão do tempo até a falha, com base nos dados disponíveis. Talvez você precise fazer algumas suposições razoáveis ​​ao calcular o tempo até a falha com base no seu produto. Por exemplo

Suposição : tempo até a falha (dias) = ​​data de retorno - data de envio

Com a tecnologia atual e os dados disponíveis, você também poderá refinar suas suposições.

Suposição aprimorada : tempo até a falha (dias) = ​​data de devolução do produto do cliente - data de recebimento do produto inicial do cliente

O que estou afirmando é que boas suposições razoáveis ​​ajudarão a gerar um bom conjunto de dados. Também na minha experiência, o cálculo básico da média e do desvio padrão ajudará a obter uma boa visão do problema em questão.

O outro ponto a ter em atenção é determinar se as falhas são devidas a

  • Causa especial
  • Causa comum

A análise da causa raiz precisa ser realizada em falhas de causa especiais e a ação corretiva precisa ser implementada. Falhas de causa comum são apenas parte de fazer negócios no setor específico e com a base de clientes específica.

Espero que esta resposta encontre uma solução razoável para o problema em questão.


Referências:

Mahendra Gunawardena
fonte
Boa menção a falhas de causas especiais. Eles poderiam ser atribuídos à fabricação, mas também ao uso em campo fora dos parâmetros operacionais sugeridos, o que anularia a garantia. Você concorda em não incluir falhas de causa especiais no MTTF?
Acumen Simulator
Além disso, qual parâmetro você está testando? Como uma população pequena falhou, eu tentaria encontrar uma distribuição para "% do total feito durante o ano X que falhou" em vez de encontrar uma distribuição para os itens reais. Você pode encontrar alguns resultados interessantes dessa maneira.
Mark
@ user38826, concordo que o MTTF não deve incluir falhas de causa especiais. Com base no OP anterior, tenho certeza de que o OP solucionou falhas devido a uma causa especial. Minha resposta está alinhada com o comentário de Mark. Talvez valha a pena investigar que falhas de causa especial não estão incluídas no MTTF.
Mahendra Gunawardena