Bom pessoal, a gente falou um pouco sobre a excelência operacional, mas agora vamos falar um pouco sobre os princípios da excelência operacional. da ws é que vamos dizer assim ele chuta a porta entendeu ele fala faça isso faça aquilo faça aquilo e depois ele detalha cada um dos passos tá mas a sem entrar no ponto do detalhamento eu quero falar que alguns princípios que vão fazer você acordar no dia a dia ou pelo menos pra você ter conhecimento específico sobre esses assuntos né sobre esses assuntos. Todos esses assuntos aqui que eu vou falar, eles não podem ser um assunto estranho para você. Você não precisa saber necessariamente colocar a mão na massa e implementar tudo isso. Claro que não. Mas não pode ser algo esquisito para você. Se você nunca nem ouviu falar sobre alguma dessas coisas, você tem que pensar. Poxa, deixa eu estudar um pouquinho sobre isso legal então vamos lá princípios da excelência operacional primeira coisa execute operações como código ia ser o que quer ia ser infraestrutura é escudo tá qual que é a grande idéia disso aí no final das contas galera toda vez que você vai subir um cluster ao invés de você fazer o clique op ou seja você entra no painel vai lá em sei lá kubernetes criar cluster tantos nós e vai clicando e etc você não vai mais fazer isso você vai utilizar ferramentas que possibilitam você fazer isso de forma automatizada tá então você consegue subir né a subir aplicações você consegue subir clusters você consegue subir tudo apenas rodando a um comando nosso é mais isso é possível é possível tá a Existem ferramentas para isso e muitas dessas ferramentas nem são tão complexas, tá? Por exemplo, se você estiver na AWS, existe a AWS CloudFormation. Na minha opinião, é bem complexo, tá? Mas uma das ferramentas mais conhecidas no mercado que fazem isso é o Terraform. O Terraform. O Terraform é uma ferramenta da Hashcorp e ele tem, vamos dizer assim, módulos ali para qualquer tipo de cloud provider, e os principais, obviamente, mas também para Kubernetes, para operações específicas. Então, imagina que caiu uma zona de disponibilidade, você tem que subir as suas aplicações. Você vai em outra zona de disponibilidade, dá um enter suas aplicações você vai em outras zonas disponibilidade da winter sob toda essa parada então entender um pouco de infraestrutura é importante tá eu não quero se você seja desenvolvedor que você seja um cara especialista em infraestrutura essa não é a idéia mas você tem que ter uma idéia de como que isso funciona né faz uma vez na vida essa parada que vai te ajudar. Outro ponto importante, faça mudanças frequentes, pequenas e reversíveis. Essa ideia é bem importante por quê? Porque toda vez que você vai fazer mudanças frequentes, o que acontece? Você tem menos chance de ter problemas e se você encontrar algum problema se você fizer algo errado o que vai acontecer você pode reverter rapidamente legal agora imagina que de uma vez só você vai querer criar um banco que vai fazer isso vai fazer aquilo daí o cara pediu uma nova feature você vai instalando vai colocando um monte de coisa, e daí de repente algo deu errado. Aonde deu errado? Deu errado foi porque, né? E aí você vai ter que sair desfazendo tudo isso. É muito complexo, tá? Então, tente fazer, sempre quando acontecer alguma mudança muito grande, você simplesmente fazer essas mudanças em pequenos steps. Legal? Outro ponto importantelire procedimentos de operação com frequência na operação galera é dia a dia né e tudo que acontece em dia a dia de empresa pode ser otimizado se tem coisas manuais muito manuais acontecendo melhore um pouquinho a cada dia toda vez que você conseguir fazer isso você está economizando você está economizando também hora homem você também está economizando pros possíveis erros e se acontecerem erros você vai refinar o processo tá você vai refinar processo para que isso não aconteça mais lembrando que na maioria das vezes o problema não está com o profissional que está tocando a operação, mas sim com o processo que ele está seguindo. Legal? Outro ponto importante é antecipar falhas. Essa é uma das coisas que ninguém gosta de fazer. Vou dar um exemplo para você. O que acontece se cai uma zona de disponibilidade agora aonde a sua aplicação tá rodando né isso pode acontecer legal o que que acontece nesse momento se o seu cluster kubernetes a for invadido como que você sobe um outro então qualquer tipo de problema que você possa ter né problemas envolvendo o cloud provider ou problemas envolvendo aquilo que você está fazendo, por consequência sua, você tem que sempre pensar em plano B. E fazer isso, o que é? É uma prática. É fazer isso com frequência. É você conseguir entender que essas coisas acontecem, que nada vai funcionar perfeito, que alguma coisa, ao longo do tempo vai dar errado e quando der errado você tem que estar mais preparado possível, para não ficar 200 pessoas no World Room decidindo o que vai fazer e daí simplesmente a coisa dá ruim. Legal? E aqui novamente, você tem que aprender com todas essas falhas. E para como que você pode fazer isso? Principal coisa que eu mais do que recomendo. Aconteceu uma falha, teve algum problema, teve algum downtime? Meu, investigue essa parada até o fundo. Crie uma espécie de um relatório explicando o porquê essa falha aconteceu. Explique também nesse relatório o que você está fazendo nesse momento pra essa falha não acontecer mais. Falhar vai acontecer, agora ficar repetindo o problema o tempo inteiro é um grande erro. E como que você faz isso? Documentando. Toda vez que você documenta algo, você cria no final das contas processo. E eu não estou falando para você criar um documento de 10 mil pá páginas para deixar sua empresa cada vez mais burocrática não documento nesse caso é processo aconteceu isso faça aquilo basicamente é isso aí beleza então quando a gente está falando em a quando está falando em excelência operacional essas guidelines aqui são extremamente importantes aí para você. Beleza? Então, vamos aí para o nosso próximo ponto aí, no próximo vídeo.