ENGENHEIRO DE DADOS
REVISE COMERCIO LTDACampinas - SP
1 posição
Não informado
Integral
Sobre nós - Grupo Revise
O Grupo Revise, atua há mais de 28 anos no setor automotivo brasileiro, destaca-se pela qualidade certificada e pelo pioneirismo. Como uma empresa 100% brasileira, possui 3 marcas, sendo: (Brazzo, Mobato e Varimaxx), com 8 centros de distribuição estratégicos em todo o país e um amplo portfólio que inclui milhares de itens de alta qualidade em prol da satisfação dos clientes, reforçados pela certificação ISO 9001:2015.
SOBRE A MOBATO
A Mobato é uma marca que oferece soluções digitais para conectar clientes ao setor automotivo, com adaptabilidade a diversas plataformas tecnológicas e integração a sistemas ERP's e DMS's. Suas soluções digitais visam transformar o atendimento de serviços em uma experiência rápida e eficiente, eliminando burocracias e proporcionando agilidade. Priorizando a satisfação do cliente, a Mobato busca compreender suas necessidades para garantir a prosperidade dos negócios. Vem ser MOBATO!
Principais responsabilidades:
- Construção e manutenção de pipelines (ETL/ELT)
-
Coletar dados de diferentes fontes (APIs, bancos relacionais, logs, arquivos, eventos).
-
Transformar e padronizar dados (limpeza, deduplicação, enriquecimento, regras de negócio).
-
Carregar dados em destinos analíticos (Data Warehouse/Lakehouse/Data Lake).
-
Orquestrar rotinas (agendamento, dependências, reprocessamento/backfill).
- Modelagem e disponibilização de dados para análise
-
Modelagem dimensional (star schema) e/ou modelos normalizados conforme o caso.
-
Criação de camadas (raw/bronze, refined/silver, curated/gold).
-
Definição de tabelas, particionamento, índices e estratégias de performance/custo.
-
Publicação de datasets “prontos para consumo” por BI, produtos e ciência de dados.
- Garantia de qualidade, confiabilidade e observabilidade
-
Testes de dados (validação de schema, null checks, ranges, integridade referencial).
-
Monitoramento de pipelines (SLA, latência, volume, falhas, dados atrasados).
-
Linhagem (data lineage) e catálogo/documentação de dados.
-
Tratamento de incidentes e análise de causa raiz.
- Colaboração com outras áreas
- Trabalhar com analistas de dados, cientistas, engenheiros de software e stakeholders.Traduzir necessidades do negócio em contratos de dados (definições, métricas, SLAs).
-
Suportar e padronizar métricas (definições únicas, “single source of truth”).
O que esperamos de você:
-
Domínio de negócio (entender métricas e impacto).
-
Capacidade de reduzir custo e melhorar performance (otimização de queries e storage).
-
Boas práticas de observabilidade (monitoramento, alertas úteis, SLAs claros).
- Boa comunicação e documentação (datasets bem descritos e fáceis de reutilizar
Linguagens e fundamentos
* SQL avançado: joins complexos, window functions, CTEs, otimização, modelagem.
* Python (ou Scala/Java): processamento, integrações, automação, testes.
* Estruturas de dados, noções de sistemas distribuídos e performance.
Bancos e storage
* Bancos relacionais: PostgreSQL/SQL Server, Athena, Redshift
* Data Warehouses/Lakehouses (conceitos e uso): particionamento, clustering, custos.
* Formatos de dados: Parquet/Avro/ORC, compressão, schema evolution.
Processamento e pipelines
* Ferramentas de orquestração: Airflow, Dagster, Prefect (ou equivalentes).
* Transformação/analytics engineering: dbt (muito comum).
* Processamento distribuído: Spark (PySpark), e alternativas conforme o stack.
Streaming e ingestão (quando aplicável)
* Kafka/Kinesis/PubSub, processamento de eventos.
* CDC (Change Data Capture) e desenho de pipelines near-real-time.
Cloud e DevOps/DataOps
* Conceitos de cloud: redes, IAM, storage, computação.
* Infra como código: Terraform.
* Containers e deploy: Docker (e às vezes Kubernetes).
* CI/CD para pipelines e modelos (tests, lint, deploy controlado).
Qualidade e governança
* Testes e validação: Great Expectations, dbt tests, checagens customizadas.
* Boas práticas de segurança: least privilege, segregação, auditoria.
Requisitos
Escolaridade
- Graduação
Habilidade Técnica
- AWS Glue
- PySpark
- Data Lake AWS
- Parquet
- Python
- Athena
Benefícios
- Estacionamento
- Consumir nossos produtos com desconto
- Refeitório - Café da Manhã e Almoço
- Cartão Flex