Médias, desvios e os eventos raros.

Médias, desvios e os eventos raros. O que podemos usar para tornar o sistema mais antifrágil?

Análise de tendências de lead time do sistema.

Não estaremos aqui discutindo a importância de se medir o lead time do sistema e o Throughput (vazão). Já avaliamos isto em tópicos anteriores.

O que vamos tratar aqui é sobre tendências. De como o sistema está se comportando.

Algumas formas bem práticas podem ser aplicadas sem muito esforço. Obviamente, precisamos ter os dados. Uma vez que temos os registros dos dados de lead time e Throughput, podemos fazer a nossa análise.

Vamos começar pelo lead time. Olhando para este gráfico a seguir podemos ver o comportamento do lead time ao longo do período de 3 meses.

eventos_raros_01

Em 85% das vezes o lead time ficou em até 21 dias. Olhando somente o percentil 85% do lead time já podemos ter uma primeira visão de previsibilidade. Podemos afirmar com 85% de certeza, que algo que começar hoje será finalizado em até 21 dias.

Porém, temos itens que ficaram acima dos 2 desvios médios. Mas porque vamos usar desvio médio ao invés do tão comum desvio padrão?  E o que é o desvio médio?

Desvio médio à A cada novo dado você precisa refazer os cálculos da média e desvio, fazendo com que a informação sobre variação seja mais precisa, mas próxima da realidade. No mundo gaussiano, O desvio padrão é cerca de 1,25 vez maior que o Desvio Médio. Mas com a volatilidade estocástica em que o desvio padrão costuma ser até 1,6 vezes a desvio médio

Desvio Padrão à Assume uma distribuição normal. Dados vão variar de forma normal (padronizada, proporcional). Não leva em consideração novos dados que podem impactar nos cálculos. Traça uma linha constante para média e desvio, de forma proporcional.

O desvio padrão não é aplicável em geral em todas as análises de séries temporais. O motivo é muito simples. Quando você tem dados que devem ser distribuídos como uma distribuição normal (ou seja, curva de sino), a fórmula de desvio padrão fornece algo significativo. No momento em que você não pode ter certeza se existe uma distribuição normal, ainda assim você ainda está usando o desvio padrão para estimar o comportamento do conjunto de dados, está abusando da fórmula e fazendo inferência incorreta sobre os dados.

Como a maioria das amostras de lead time demonstram comportamento não normalizado, com cauda muito gorda, o uso de desvio padrão em qualquer análise é inadequado. Infelizmente, observamos esse uso em várias análises de lead time em todos os lugares.

N.N. Taleb, autor dos best sellers “A Lógica do Cisne Negro” e “Antifrágil”, sugere em seus estudos que o Desvio Médio Absoluto (DMA) é uma melhor medida do comportamento da distribuição. Em seu artigo[1], o Sr. Taleb já forneceu evidências convincentes de que o Desvio Médio Absoluto é superior ao Desvio Padrão para todos os dados da vida real. Não vou repetir o que ele diz no artigo. É uma boa ideia, pelo menos, navegar pelo artigo dele quando tiver a chance.

Na minha experiência, o desvio padrão costuma reagir incorretamente, enquanto o desvio médio não sofre o mesmo problema. Em outras palavras, se você optar por usar o desvio padrão como sua medida de volatilidade, frequentemente encontrará sinais positivos falsos devido ao aumento repentino nas leituras de desvio padrão. Se você substituir o desvio padrão pelo desvio médio, o problema provavelmente desaparecerá, oferecendo melhores resultados no geral.

Diante desta explanação, vamos olhar para o gráfico de lead time, agora com as linhas do desvio médio

eventos_raros_02

Considerando dois desvios padrão em relação à média, somente uma ocorrência de lead time estará acima da linha. Isto pode nos levar a uma falsa avaliação de que o processo está com somente uma ocorrência, digamos, “fora da curva”.

Quando analisamos, porém, a partir dos desvios médios, percebemos que pelo menos três pontos estão acima da linha. 300% de aumento na ocorrência de pontos “fora da curva” . Seriam pontos que não estávamos considerando numa eventual análise para melhoria do processo ou análise de riscos, ou seja, na sua Risk Review ou Service Delivery Review. E que podem nos levar a falhas na tomada de decisão e, num futuro, que não podemos precisar quando, levar à ocorrência de eventos raros, mas com grande impacto para o negócio.

Portanto, daqui em diante procure trabalhar as suas análises de lead time utilizando desvios médios e não mais o desvio padrão

 

Fonte: https://www.edge.org/response-detail/25401

[1] https://twitter.com/nntaleb/status/1134012746046025729?s=09

About The Author

Rodrigo Almeida de Oliveira

Accredited Kanban University Trainer (AKT), Kanban Coach Professional (KCP) and PMP®, Rodrigo Almeida de Oliveira has been working in the IT area for over 20 years and has solid experience in project management and software factories, working with agile approaches by more than 5 years. Rodrigo also has a master's degree in Engineering and Process and Systems Management, with emphasis on process improvement and optimization and quality through agile methods.

Deixe sua opinião!

1 Comment

  • Dionei

    Reply Reply 12/05/2020

    Muito bacana o seu artigo Oliveira!
    Tks pelo material!

Leave A Response

* Denotes Required Field