TO Brasil

Analista de Operações e Observabilidade Sênior

Publicada em: 28 de agosto de 2023

Tipo de contrato: Efetivo

Rio de Janeiro

DESCRIÇÃO

O analista de operações e Observabilidade será o responsável por garantir que sistemas de software e infraestrutura operem de maneira eficiente, confiável e escalável. Ele irá monitorar, coletar e analisar os dados relacionados ao desempenho, disponibilidade e comportamento dos sistemas para identificar problemas, para então gerar demandas de otimização para melhorar a experiência do usuário.

requisitos / exigências

Requisitos Indispensáveis
Formação acadêmica: Graduação em Ciência da Computação, Redes, Tecnologia DevOps, Engenharia de Sistemas ou áreas relacionadas.
1. Conhecimentos técnicos:
• Experiência em operação de sistemas e infraestrutura de TI.
• Conhecimento de sistemas operacionais, como Windows Server e Linux.
• Familiaridade com redes de computadores e protocolos de comunicação.
• Conhecimento em virtualização (VMware) e cloud computing (AWS).
• Compreensão de conceitos de armazenamento de dados e backup.
• Experiência em monitoramento e resolução de problemas em ambientes de produção.
• Conhecimento de ferramentas de automação, como PowerShell ou Ansible.
2. Habilidades técnicas adicionais:
• Familiaridade com ambientes de contêineres, como Docker e Kubernetes.
• Conhecimento em ferramentas de monitoramento de infraestrutura, como PRTG ou Zabbix.
• Conhecimento em ferramentas APM, de preferência conhecimento na implantação e operação do Dynatrace.
• Experiência em implementação e administração de serviços de nuvem, como AWS, Azure ou Google Cloud Platform.
• Compreensão de práticas de segurança da informação e conformidade.
3. Habilidades interpessoais:
• Habilidade de resolver problemas sob pressão em ambientes de produção.
• Excelentes habilidades de comunicação e colaboração.
• Capacidade de trabalhar em equipe e coordenar atividades com outras áreas.
• Capacidade de planejar e priorizar tarefas.
• Flexibilidade e adaptabilidade para lidar com mudanças e situações imprevistas.
Atividades / Responsabilidades
Rotina do Analista de Operações e Observabilidade
Manhã:
1. Verificação das Alertas Iniciais: Começar o dia verificando alertas e notificações que foram geradas durante a noite. Isso pode incluir alertas de sistemas de monitoramento que indicam problemas potenciais.
2. Revisão dos Dashboards: Analisar dashboards de monitoramento que exibem métricas-chave de sistemas e aplicativos. Isso pode envolver verificar o desempenho de servidores, bancos de dados, serviços e outros componentes críticos.
3. Triagem de Incidentes: Caso algum incidente tenha ocorrido durante a noite, o analista começa a triagem. Eles investigam a causa raiz, identificam o impacto nos usuários e iniciam as ações corretivas necessárias.
Tarde:
1. Análise de Dados de Performance: Analisar os dados coletados sobre o desempenho dos sistemas ao longo do dia. Isso pode envolver a identificação de tendências, gargalos de desempenho e possíveis áreas de melhoria.
2. Otimização e Ajustes: Com base na análise de dados, o analista pode tomar decisões sobre ajustes de configuração, escalonamento de recursos ou otimizações de código para melhorar o desempenho e a eficiência dos sistemas.
3. Desenvolvimento de Novos Indicadores: Identificar métricas adicionais que podem fornecer insights valiosos sobre o sistema. Isso pode envolver a criação de novos dashboards ou a configuração de alertas com base nessas métricas.
Final da Tarde:
1. Preparação para Reuniões: Se houver reuniões de equipe ou atualizações de status agendadas, o analista pode preparar informações sobre incidentes recentes, melhorias implementadas ou métricas relevantes.
2. Documentação: Atualizar documentação interna, incluindo procedimentos operacionais padrão, respostas a incidentes anteriores e mudanças de configuração implementadas.
3. Planejamento para o Dia Seguinte: Rever o progresso feito durante o dia, priorizar tarefas pendentes e identificar as principais áreas de foco para o dia seguinte. Isso pode envolver a identificação de projetos de longo prazo para melhorias contínuas.
Considerações Gerais:
• O analista de operações e observabilidade frequentemente trabalha em colaboração com equipes de desenvolvimento, operações e outras áreas para garantir um ambiente de produção estável.
• A capacidade de análise de dados é fundamental, pois os analistas usam métricas, logs e informações de rastreamento para entender o comportamento do sistema.
• A automação desempenha um papel importante, com scripts e ferramentas sendo usados para automatizar tarefas de monitoramento, coleta de dados e resolução de problemas.
• O aprendizado contínuo é essencial, pois a tecnologia e as melhores práticas estão sempre evoluindo.
Conhecimentos necessários para as atividades de melhorias
Para as integrações e desenvolvimento de dashboards no Grafana, além de configurações de alarmes no Microsoft Teams, será necessário uma série de conhecimentos. Aqui estão os principais conhecimentos que o candidato precisa ter:
1. Monitoramento e Observabilidade:
o Compreensão dos conceitos de monitoramento, observabilidade e seus objetivos.
o Familiaridade com métricas, logs e rastreamento de transações.
o Capacidade de identificar métricas-chave para medir o desempenho e a saúde dos sistemas.
2. Ferramentas de Monitoramento e Observabilidade:
o Conhecimento profundo das ferramentas que você mencionou, como Grafana, Kibana, Zabbix, Dynatrace, Tenable e Wazuh SIEM.
o Habilidade para configurar, personalizar e otimizar essas ferramentas para atender às necessidades da organização.
3. Grafana:
o Experiência em criação de dashboards interativos e visualmente atraentes.
o Conhecimento em linguagens de consulta, como SQL, para extrair dados de fontes variadas.
o Compreensão das diferentes opções de painéis, gráficos e tabelas disponíveis no Grafana.
o Habilidade para integrar várias fontes de dados e criar painéis consolidados.
4. Kibana:
o Habilidade para criar visualizações e dashboards a partir de logs e dados do Elasticsearch.
o Familiaridade com consultas de pesquisa e filtragem de logs para identificação de eventos relevantes.
5. Zabbix:
o Conhecimento na configuração de monitoramento de infraestrutura, redes e aplicativos.
o Capacidade de criar triggers e alertas personalizados com base em métricas.
6. Dynatrace:
o Experiência em monitoramento de desempenho de aplicativos e infraestrutura.
o Capacidade de configurar monitoramento automatizado para identificar gargalos e anomalias.
7. Tenable:
o Conhecimento em análise de vulnerabilidades e configurações de segurança.
o Habilidade para criar e interpretar relatórios de segurança e avaliar riscos.
8. Wazuh SIEM:
o Familiaridade com sistemas de gerenciamento de eventos e informações de segurança.
o Experiência em detecção de ameaças e análise de logs de segurança.
9. Integrações e Automação:
o Habilidade para integrar as diferentes ferramentas e fontes de dados em um ecossistema unificado.
o Conhecimento em automação de tarefas, como criação de scripts para configuração e implantação.
10. Microsoft Teams:
• Familiaridade com a configuração de canais, notificações e integrações no Microsoft Teams.
• Habilidade para configurar alertas e notificações de diferentes fontes de dados.
11. Segurança da Informação:
• Compreensão dos princípios de segurança da informação e melhores práticas para proteção de dados sensíveis.
12. Práticas de Colaboração:
• Habilidade para trabalhar em equipe, comunicar problemas e soluções de forma clara e eficaz.

benefícios

Vale Refeição

Plano de Saúde

inscrições

Clique no botão abaixo para se candidatar via e-mail.

veja mais: