SRE Partner
Jusbrasil
Posted: April 28, 2026
Interested in this position?
Create a free account to apply with AI-powered matching
Quick Summary
Liderar a transformação tecnológica da Justiça no Brasil com um sistema de IA-first e dados massivos
Required Skills
Job Description
Sobre o Jusbrasil
Transformar o sistema de Justiça com tecnologia não é um desafio trivial. Por isso, o Jusbrasil se posiciona como uma empresa AI-first, que utiliza IA Generativa, dados massivos e engenharia de ponta para resolver problemas complexos e criar impacto real em escala.
Estamos vivendo um ponto de virada: a revolução da GenAI está redefinindo o mercado, e temos nas mãos uma oportunidade rara de liderar a transformação tecnológica do sistema jurídico no Brasil.
Lidamos com petabytes de dados, bilhões de documentos e desafios de escala, precisão e relevância dignos das maiores techs do mundo.
Nosso time opera com alta densidade de talentos, autonomia e propósito. São centenas de pessoas incríveis espalhadas por mais de 40 cidades no Brasil e fora, unidas pela mesma missão: construir soluções que melhorem o acesso à Justiça e ampliem a confiança nas relações sociais.
Aqui, valorizamos quem busca domínio profundo, age com clareza de propósito e tem energia para enfrentar grandes desafios com consistência e excelência.Estamos construindo algo grande e queremos pessoas que queiram fazer parte dessa história, com intensidade, foco e excelência.
Jusbrasil em números:
+ de 1,2 bi de documentos jurídicos de interesse público
+ de 1PB de dados na nossa infraestrutura de tecnologia
+ de 30 m de usuários
+ de 500 colaboradores
+ de 80% dos advogados brasileiros cadastrados
Sobre a posição
O Jusbrasil está em busca de uma pessoa Senior Site Reliability Engineer para atuar como SRE Partner — um papel estratégico criado para aproximar a engenharia de confiabilidade das Áreas de Produto (PAs) onde o impacto é mais direto.
A peça central da nossa engenharia é a Agentic Engineering Platform — uma plataforma onde desenvolvedores declaram intenção e agentes de IA abstraem a complexidade de infraestrutura, reduzindo carga cognitiva e acelerando a entrega. O SRE Partner é o elo humano entre essa plataforma e os times de produto: a pessoa que entende as dores reais de cada PA, implementa a agenda de SRE no dia a dia dos times e garante a adoção dos recursos da plataforma onde eles mais importam.
Essa posição atua de forma alocada nas PAs prioritárias com foco em elevar a maturidade de confiabilidade de cada time, reduzir riscos operacionais e construir uma cultura orientada a dados, SLOs e resposta a incidentes. Quem ocupa esse papel não apenas diagnostica problemas: vende soluções, influencia decisões e age como embaixador da plataforma de engenharia.
Desafios da posição
• Ser alocada em PAs críticas e ganhar rapidamente contexto das suas dores, riscos e arquitetura, iniciando entregas de alto impacto nos primeiros meses.
• Implementar a agenda de SRE nas PAs: definição de SLOs, estruturação de on-call, runbooks, gestão de incidentes e post-mortems.
• Construir e evoluir uma matriz de maturidade de SRE para cada PA, mapeando o estado atual e definindo o caminho de evolução.
• Identificar riscos operacionais — pontos únicos de falha, serviços sem dono, alertas ruidosos — e atuar proativamente para eliminá-los antes que virem incidentes.
• Ser o embaixador da Agentic Engineering Platform nas PAs: promover a adoção de Golden Paths, canary deployments, feature flags, dashboards automatizados e demais recursos da plataforma.
• Trabalhar próxima dos times de produto para garantir que as práticas de SRE sejam parte do fluxo natural de desenvolvimento — e não um processo paralelo.
• Levantar dados e gerar insights acionáveis sobre disponibilidade, latência, toil e uso de infraestrutura para orientar decisões nas PAs.
Responsabilidades
• Garantir confiabilidade, disponibilidade e escalabilidade dos sistemas e serviços das PAs onde estiver alocada.
• Desenvolver e implementar soluções de monitoramento, observabilidade e alertas integradas à Agentic Engineering Platform.
• Apoiar os times na definição e acompanhamento de SLIs, SLOs e error budgets.
• Estruturar e evoluir a gestão de on-call nas PAs: rotação, escalation, ferramental de acionamento e gestão de incidentes.
• Trabalhar em estreita colaboração com a Engineering Platform para garantir que os recursos da plataforma cheguem e sejam adotados nos times de produto.
• Contribuir ativamente para a evolução da Agentic Engineering Platform, trazendo feedback real das PAs sobre fricções, gaps e oportunidades de melhoria.
• Participar e influenciar a construção de uma cultura de engenharia orientada à confiabilidade (SRE) em toda a empresa.
• Apoiar migrações de sistemas críticos, segregação de ambientes e deprecation de tecnologias legadas.
Requisitos
• Experiência com ambientes em nuvem, preferencialmente GCP.
• Proficiência em ferramentas e práticas de observabilidade (Prometheus, Grafana, Loki, Thanos, Elasticsearch, AlertManager etc.).
• Sólido conhecimento em Kubernetes e arquitetura distribuída.
• Sólido conhecimento de infraestrutura como código (IaC) e Terraform.
• Experiência prática com gestão de incidentes, on-call e post-mortems.
• Experiência com definição e acompanhamento de SLOs e error budgets.
• Capacidade de análise de logs e desempenho de sistemas distribuídos.
• Forte habilidade de comunicação e influência: saber vender soluções técnicas para audiências diversas — engenheiros, PMs e lideranças.
• Visão data-driven, usando dados para mapear riscos, priorizar ações e demonstrar impacto.
Diferenciais
• Experiência em ambientes multi-cloud ou empresas com grande volume de acesso.
• Experiência em desenvolvimento de software e boas práticas de engenharia de produto.
• Vivência anterior em papel de SRE embedded ou alocado em times de produto.
• Contribuições relevantes em projetos de observabilidade, redução de toil ou automação de operações.
• Familiaridade com conceitos de plataformas de engenharia (Internal Developer Platforms, Golden Paths, Developer Experience).
• Experiência com ferramentas de gestão de incidentes como **incident.io ou Grafana IRM**.