Resumo da Equipe DFI
Como Engenheiro de Confiabilidade de Site (SRE) no DFI Retail Group, você será a ponte entre desenvolvimento e operações, garantindo que nossos sistemas sejam projetados, implementados e mantidos para máxima confiabilidade, escalabilidade e desempenho. Você aproveitará sua experiência em engenharia de software para automatizar operações, otimizar o desempenho do sistema e desenvolver soluções que previnam problemas recorrentes. Seu trabalho será essencial para garantir uma experiência contínua para nossos usuários, mantendo a alta disponibilidade e eficiência de nossos serviços.
Este é o seu próximo desafio em Engenharia de Confiabilidade de Site?
Responsabilidades:
- Projetar e Implementar Soluções para Confiabilidade e Escalabilidade: Desenvolver e implementar arquiteturas de sistema altamente escaláveis e disponíveis para atender à crescente demanda dos usuários sem comprometer o desempenho.
- Automatizar Operações: Projetar, construir e integrar ferramentas de software para automatizar processos operacionais, incluindo monitoramento de sistemas, resposta a incidentes e procedimentos de implantação.
- Otimizar o Desempenho do Sistema: Monitorar proativamente o desempenho do sistema, identificar gargalos e implementar estratégias de otimização para garantir a utilização eficiente de recursos e a entrega de serviços.
- Implementar e Gerenciar Monitoramento e Observabilidade: Estabelecer métricas de serviço abrangentes e implementar sistemas de monitoramento robustos para rastrear, analisar e relatar sobre a confiabilidade, desempenho e eficiência do sistema, incluindo, mas não se limitando aos seguintes sistemas de monitoramento (New Relic, Azure Monitor e Google Cloud Monitoring). Utilizar ferramentas de observabilidade para obter insights mais profundos sobre o comportamento do sistema e identificar proativamente possíveis problemas.
- Resposta e Resolução de Incidentes: Desenvolver e implementar estratégias para detecção e resposta rápida a incidentes. Solucionar e resolver problemas complexos do sistema, minimizando o tempo de inatividade e mitigando interrupções no serviço.
- Planejamento de Capacidade e Ajuste de Desempenho: Conduzir análises de planejamento de capacidade para antecipar necessidades futuras de recursos e garantir a escalabilidade do sistema. Ajustar proativamente o desempenho do sistema para otimizar a utilização de recursos e manter os acordos de nível de serviço (SLAs).
- Colaboração com Equipes de Desenvolvimento: Trabalhar em estreita colaboração com equipes de desenvolvimento de software para integrar considerações de confiabilidade ao longo do ciclo de vida do desenvolvimento de software. Participar de revisões de código, discussões de design e revisões pós-incidente para aprimorar a confiabilidade do sistema e prevenir problemas recorrentes.
- Impulsionar a Melhoria Contínua: Avaliar continuamente os processos e ferramentas existentes, identificando áreas para melhoria e automação. Pesquisar e implementar novas tecnologias e melhores práticas para aprimorar a confiabilidade do sistema e a eficiência operacional.
- Documentação e Compartilhamento de Conhecimento: Criar e manter documentação abrangente para sistemas, processos e respostas a incidentes. Compartilhar ativamente conhecimento e melhores práticas com a equipe e a organização.
- Administrar a Suíte de Produtos Atlassian: Gerenciar e manter a suíte de produtos Atlassian, incluindo Jira, Confluence e Bitbucket, garantindo operação e integração contínuas com os fluxos de trabalho existentes. Fornecer suporte e treinamento aos usuários conforme necessário.
Você tem experiência como Engenheiro de Confiabilidade de Site?
Qualificações:
- Graduação em Ciência da Computação, Engenharia ou área relacionada, ou experiência equivalente.
- Experiência comprovada (pelo menos 3 anos) como SRE, Engenheiro de DevOps ou em um papel similar, demonstrando uma forte compreensão dos princípios de engenharia de software e operações de TI.
- Experiência prática na administração da suíte de produtos Atlassian (Jira, Confluence e Bitbucket).
- Conhecimento profundo de plataformas em nuvem como AWS, Azure ou GCP, incluindo serviços relacionados a computação, armazenamento, redes e bancos de dados.
- Proficiência em linguagens de script como Python ou PowerShell e experiência com ferramentas de automação como Terraform ou Ansible.
Familiaridade com sistemas de monitoramento e registro (Prometheus, Zabbix, Grafana, ELK, Azure Monitor, Google Monitoring)
- Experiência prática com tecnologias de containerização como Docker e ferramentas de orquestração de containers como Kubernetes.
- Forte compreensão de conceitos e protocolos de rede.
- Experiência com pipelines CI/CD e ferramentas para integração contínua, entrega contínua e automação de infraestrutura.
- Sólido entendimento das melhores práticas de segurança para ambientes de nuvem.
- Fortes habilidades analíticas e de resolução de problemas, com a capacidade de identificar causas raízes e implementar soluções eficazes.
- Excelentes habilidades de comunicação e colaboração, com a capacidade de trabalhar efetivamente dentro de uma equipe e comunicar detalhes técnicos para públicos técnicos e não técnicos.
Se você possui as habilidades e a experiência certas, esta é uma oportunidade para construir sua carreira com o varejista líder da Pan Ásia.
O DFI Retail Group é um empregador que oferece igualdade de oportunidades e é responsável por garantir que todas as informações pessoais coletadas de cada candidato apresentado ao DFI Retail Group sejam utilizadas apenas para fins de recrutamento e que os dados pessoais sejam mantidos e tratados de forma confidencial. Vamos reter as candidaturas de candidatos não selecionados por um período máximo de 24 meses. O processo de coleta de dados está em conformidade com todas as leis aplicáveis e em conformidade com o Código de Práticas de Gestão de Recursos Humanos.
Para saber mais sobre nossos negócios e nossas pessoas, visite nosso site: https://www.DFIretailgroup.com
Emitido pela The Dairy Farm Company, Limited
Requisito
Por favor, consulte a descrição do trabalho.