ENGENHEIRO DE DADOS

REVISE COMERCIO LTDA

Campinas - SP

1 posição

Não informado

Integral

CLT
Híbrido
Pleno
Tecnologia

Sobre nós - Grupo Revise

O Grupo Revise, atua há mais de 28 anos no setor automotivo brasileiro, destaca-se pela qualidade certificada e pelo pioneirismo. Como uma empresa 100% brasileira, possui 3 marcas, sendo: (Brazzo, Mobato e Varimaxx), com 8 centros de distribuição estratégicos em todo o país e um amplo portfólio que inclui milhares de itens de alta qualidade em prol da satisfação dos clientes, reforçados pela certificação ISO 9001:2015. 

 

SOBRE A MOBATO

A Mobato é uma marca que oferece soluções digitais para conectar clientes ao setor automotivo, com adaptabilidade a diversas plataformas tecnológicas e integração a sistemas ERP's e DMS's. Suas soluções digitais visam transformar o atendimento de serviços em uma experiência rápida e eficiente, eliminando burocracias e proporcionando agilidade. Priorizando a satisfação do cliente, a Mobato busca compreender suas necessidades para garantir a prosperidade dos negócios. Vem ser MOBATO!

 

Principais responsabilidades:

  • Construção e manutenção de pipelines (ETL/ELT)
  • Coletar dados de diferentes fontes (APIs, bancos relacionais, logs, arquivos, eventos).

  • Transformar e padronizar dados (limpeza, deduplicação, enriquecimento, regras de negócio).

  • Carregar dados em destinos analíticos (Data Warehouse/Lakehouse/Data Lake).

  • Orquestrar rotinas (agendamento, dependências, reprocessamento/backfill).

  • Modelagem e disponibilização de dados para análise
  • Modelagem dimensional (star schema) e/ou modelos normalizados conforme o caso.

  • Criação de camadas (raw/bronze, refined/silver, curated/gold).

  • Definição de tabelas, particionamento, índices e estratégias de performance/custo.

  • Publicação de datasets “prontos para consumo” por BI, produtos e ciência de dados.

  • Garantia de qualidade, confiabilidade e observabilidade
  • Testes de dados (validação de schema, null checks, ranges, integridade referencial).

  • Monitoramento de pipelines (SLA, latência, volume, falhas, dados atrasados).

  • Linhagem (data lineage) e catálogo/documentação de dados.

  • Tratamento de incidentes e análise de causa raiz.

  • Colaboração com outras áreas
  • Trabalhar com analistas de dados, cientistas, engenheiros de software e stakeholders.Traduzir necessidades do negócio em contratos de dados (definições, métricas, SLAs).
  • Suportar e padronizar métricas (definições únicas, “single source of truth”).

O que esperamos de você:

  • Domínio de negócio (entender métricas e impacto).

  • Capacidade de reduzir custo e melhorar performance (otimização de queries e storage).

  • Boas práticas de observabilidade (monitoramento, alertas úteis, SLAs claros).

  • Boa comunicação e documentação (datasets bem descritos e fáceis de reutilizar

Linguagens e fundamentos

* SQL avançado: joins complexos, window functions, CTEs, otimização, modelagem.
* Python (ou Scala/Java): processamento, integrações, automação, testes.
* Estruturas de dados, noções de sistemas distribuídos e performance.

Bancos e storage

* Bancos relacionais: PostgreSQL/SQL Server, Athena, Redshift
* Data Warehouses/Lakehouses (conceitos e uso): particionamento, clustering, custos.
* Formatos de dados: Parquet/Avro/ORC, compressão, schema evolution.

Processamento e pipelines

* Ferramentas de orquestração: Airflow, Dagster, Prefect (ou equivalentes).
* Transformação/analytics engineering: dbt (muito comum).
* Processamento distribuído: Spark (PySpark), e alternativas conforme o stack.

Streaming e ingestão (quando aplicável)

* Kafka/Kinesis/PubSub, processamento de eventos.
* CDC (Change Data Capture) e desenho de pipelines near-real-time.

Cloud e DevOps/DataOps

* Conceitos de cloud: redes, IAM, storage, computação.
* Infra como código: Terraform.
* Containers e deploy: Docker (e às vezes Kubernetes).
* CI/CD para pipelines e modelos (tests, lint, deploy controlado).

Qualidade e governança

* Testes e validação: Great Expectations, dbt tests, checagens customizadas.
* Boas práticas de segurança: least privilege, segregação, auditoria.

 

Requisitos

Escolaridade

  • Graduação

Habilidade Técnica

  • AWS Glue
  • PySpark
  • Data Lake AWS
  • Parquet
  • Python
  • Athena

Benefícios

  • Estacionamento
  • Consumir nossos produtos com desconto
  • Refeitório - Café da Manhã e Almoço
  • Cartão Flex

Localização

Rua Francisco Ceará Barbosa, Chácaras Campos dos Amarais, Campinas - SP, Brasil, 13082-030