Marcelo Baptista

Curitiba - PR

Sou um Engenheiro de Confiabilidade (SRE) com um pé na Engenharia de Plataformas que gosta de descomplicar o complexo. No meu dia a dia, gosto de contribuir para que os sistemas complexos sejam compreensíveis, resilientes e eficientes por design e de criar pontes entre os times para que Confiabilidade seja uma responsabilidade compartilhada, e não um incêndio a ser apagado.

Acredito que a melhor infraestrutura é aquela que quase ninguém percebe — porque simplesmente funciona, e que Observabilidade vai além de dados e dashboards, e sim feita para se transformar em entendimento coletivo, democratizada e com o objetivo de tomar decisões acertadas.

Como bom entusiasta de código aberto e de Software Livre, adoro participar de comunidades técnicas, compartilhar conhecimento e aprender com outros profissionais, pois acredito que a colaboração é o motor da inovação tecnológica. Atualmente estou como membro do comitê de organização do DevOpsDays Curitiba e da organização do Cloud Native Community Group Curitiba.

Vamos conversar? Me encontre através de qualquer um dos canais abaixo:


Minha jornada

Minha jornada começou na telefonia, suporte e cabeamento estruturado, lidando diretamente com as necessidades dos usuários. Naturalmente migrei para infraestrutura e redes, atuando com automação, monitoramento, servidores e dispositivos de redes, e foi onde solidifiquei minha base técnica.

Após muitos anos, redirecionei minha carreira para Cloud, Containers, IaC, Orquestração e entrei de cabeça na cultura DevOps e SRE, o que me despertou interesse em cursar pós-graduação em Site Reliability Engineer.

Minha paixão por tecnologia e aprendizado contínuo me mantém sempre atualizado com as últimas tendências e melhores práticas do mercado, especialmente no universo de Observabilidade, onde atuo hoje com muita paixão. Cada etapa dessa jornada contribuiu para minha visão única de como a tecnologia deve, acima de tudo, servir às pessoas de forma simples, acessível e confiável.


Experiência profissional

Senior Site Reliability Engineer

C6 Bank

No C6 Bank, atuo diretamente na construção e operação das plataformas de observabilidade em ambientes críticos 24/7. Minha atuação abrange desde a implementação técnica até a estratégia de observabilidade, sempre focando em confiabilidade, eficiência e inovação.

  • Implementação e administração de soluções de logs, métricas, traces e APM, incluindo OpenTelemetry, Splunk, AppDynamics, Prometheus, VictoriaMetrics, Grafana, Tempo, FluentBit e Zabbix.
  • Implantação, customização e configuração de exporters para Prometheus (OracleDB, YACE, Node Exporter, Stackdriver).
  • Automação de funções nas plataformas de observabilidade para reduzir toil, gerar relatórios e melhorar a eficiência operacional.
  • Aplicação de práticas de FinOps para otimização de custos e recursos em nuvem (AWS/GCP).
  • Participação em projetos de melhoria contínua da observabilidade, alinhados às demandas de ITOps e times de produtos.
  • Resolução proativa de incidentes relacionados ao ambiente de observabilidade, garantindo estabilidade e desempenho.
  • Envolvimento com times multidisciplinares para promover cultura de observabilidade como padrão.
  • Contribuição para a definição de padrões, boas práticas e governança das plataformas de observabilidade.
Agosto 2023 - Atualmente

Especialista em Automação de Processos IV

G&P Projetos e Sistemas

Na Caixa Econômica Federal, gerenciei as ferramentas Zabbix e Grafana, realizando projetos de monitoramento, documentação, criação de scripts em bash integrados ao Zabbix para automação de processos e criação de novos monitoramentos em ambiente Linux e de alta complexidade envolvendo plataforma alta e plataforma baixa.

Participei também em alguns projetos de observabilidade e monitoramento envolvendo a criação de dashboards com Azure Log Analytics, Azure Metric Analytics, Azure Application Insights e Azure VM Insights.

Novembro 2020 - Agosto 2022

Especialista em TI

Ziva Tecnologia e Soluções

Alocado na Infraero, prestando serviços em diversos aeroportos, incluindo Santos Dumont, Jacarépaguá, Macaé, Campos, Estação Prestadora de Serviço de Telecomunicações e de Tráfego Aéreo Galeão, além da Unidade Administrativa do Rio de Janeiro Durante esse período, desempenhei diversas atividades, tais como:

  • Administração, instalação e configuração de servidores físicos e virtuais com Windows e Linux (CentOS, Ubuntu e Oracle Linux)
  • Administração de serviços do Windows Server, como Print Server, DHCP, DNS, DFS, File Server, WDS e WSUS
  • Administração do Active Directory, gerenciando usuários, acessos e políticas de grupo da Infraero no Rio de Janeiro
  • Gerenciamento das ferramentas Zabbix e Grafana
  • Análise de links MPLS com a ferramenta Fluke Visual TrueView e abertura de chamados com as operadoras
  • Gerenciamento, Monitoramento, geração de relatórios e automação da rede de dados utilizando a ferramenta HPE Intelligent Management Center Enterprise
  • Criação e gerenciamento de rotas estáticas, ACLs, NAT, VLANs, VRRP, LACP, Trunks, VLANs, dot1x, bem como solução de problemas relacionados
  • Gerenciamento de ranges de endereços IPs, subnets e VLANs utilizando a ferramenta PHPIPAM
  • Administração, instalação e configuração de switches de várias marcas, como Aruba, HPE, 3Com, Allied Telesis e Cisco
  • Elaboração e manutenção da documentação técnica do ambiente de TI
Agosto 2014 - Outubro 2020

Técnico de Suporte Pleno

Ziva Tecnologia e Soluções

Alocado no prédio da Superintendência Regional do Rio de Janeiro da empresa Infraero, atuei com suporte técnico remoto e presencial aos usuários. Durante minha atuação, realizei diversas atividades de suporte como:

  • Instalação e configuração de softwares corporativos e de mercado
  • Formatação e configuração de estações de trabalho em domínio Windows
  • Apoio em eventos corporativos
  • Inventário de estações de trabalho
  • Configurações básicas em switches L3 (HPE, 3Com) como dot1x, VLAN, entre outras
Julho 2011 - Agosto 2014

Formação Acadêmica

Pontifícia Universidade Católica de Minas Gerais

Pós-graduação Lato Sensu - Site Reliability Engineering
Abril 2023 - Maio 2024

Universidade CESUMAR

Tecnólogo em Sistemas para Internet - Web Developer
Janeiro 2020 - Novembro 2022

Cursos e Certificações

Certificações

  • GitOps Fundamentals Certified - Codefresh
  • GitLab Certified Associate - Gitlab
  • Oracle Cloud Infrastructure Certified Architect Associate
  • Oracle Cloud Infrastructure Foundations Certified Associate
  • Microsoft Azure Fundamentals

Cursos

  • Splunk Cloud Administration
  • Splunk Knowledge Manager Learning Path
  • Splunk Search Expert Learning Path
  • Splunk Search Beginner Learning Path
  • Splunk Knowledge Manager Learning Path
  • Splunk Search Expert Learning Path
  • Splunk Search Beginner Learning Path
  • Intermediate for Istio
  • Fundamentals for Istio
  • Fundamentals for Envoy
  • Mutirão DevOps - LINUXtips
  • CCNA R&S: Introduction to Networks - Cisco
  • Cybersecurity Essentials - Cisco

Habilidades técnicas

  • Linux
  • Shell Script
  • Plataformas de Logs
  • Plataformas de Métricas
  • Plataformas de Traces / APM
  • Time Series Databases
  • IaC: Terraform e Ansible
  • Kubernetes
  • Clouds públicas: Azure, AWS, GCP, OCI

Projetos realizados

Migração Zabbix 3.4 para Zabbix 5.0.7

Caixa / RJ
  • Arquitetura, documentação e implantação do novo ambiente de monitoramento, com cerca de 5000 hosts e todos os sistemas da Caixa/RJ, assim como os scripts de automação de processos e demais necessidades do cliente
  • Melhorias no monitoramento utilizando funcionalidades não existentes na versão anterior, novos templates customizados e re-adequados ao ambiente.
2021 - 2022

Distribuição SIVLinux

Infraero / Brasil
  • Remasterização baseada na distribuição Xubuntu Linux versão 18.04, customizada, 1-click install, construída para executar o Sistema Informativo de Voos, desenvolvido pela Infraero, em todos os aeroportos do Brasil pertencentes à rede Infraero
  • Documentação técnica do projeto, treinamento e acompanhamento de equipes através de cronogramas planejados em reuniões
  • Custos com licenciamento foram drasticamente reduzidos, e também foi possível utilizar hardwares mais modestos e/ou antigos antes considerados obsoletos
2017 - 2018