← Todos os artigos
Tecnologia9 min de leitura

Stack da gringa: as tecnologias que empresas americanas e europeias mais contratam em dados

Descubra quais ferramentas, linguagens e plataformas dominam o mercado internacional de dados e onde focar seus estudos para se tornar competitivo.

Daniel Rocha·

Stack da gringa: as tecnologias que empresas americanas e europeias mais contratam em dados

Existe um gap entre a stack que a maioria dos profissionais de dados usa no Brasil e a stack que empresas americanas e europeias exigem. Esse gap não é intransponível, mas ignorar ele é um dos motivos pelos quais profissionais tecnicamente competentes não passam nas triagens de vagas internacionais.

A boa notícia: o mercado internacional de dados converge para um conjunto relativamente previsível de ferramentas. Se você souber onde focar, consegue se tornar competitivo em meses, não anos.

O gap entre a stack brasileira e a stack internacional

No Brasil, o mercado de dados ainda é dominado por algumas combinações clássicas: SQL Server + SSIS + Power BI em empresas mais tradicionais, Python + PostgreSQL + Metabase em startups, e alguma variação de Spark em empresas maiores.

Não há nada de errado com essas ferramentas. O problema é que elas representam uma geração anterior da infraestrutura de dados. O mercado internacional já seguiu em frente.

Segundo o State of Data Engineering Report 2025 do dbt Labs, mais de 78% das empresas americanas com mais de 200 funcionários já migraram ou estão migrando para o que o mercado chama de Modern Data Stack, uma arquitetura cloud-native, modular e baseada em ferramentas especializadas.

Profissionais que dominam apenas ferramentas on-premise ou stacks monolíticas ficam em desvantagem imediata.

Cloud: a base de tudo

Nenhuma conversa sobre stack internacional começa sem cloud. A distribuição entre os três grandes provedores no mercado de dados:

  • AWS: lidera em adoção geral. Redshift, Glue, S3, EMR e Athena são os serviços de dados mais usados. Cerca de 45% das vagas internacionais de dados mencionam AWS.
  • GCP (Google Cloud): ganhou espaço nos últimos 3 anos, principalmente com BigQuery, Dataflow e Dataproc. Aparece em aproximadamente 30% das vagas, com presença forte em empresas de tecnologia e startups.
  • Azure: mais comum em empresas enterprise e no setor financeiro europeu. Synapse Analytics, Data Factory e Azure Databricks são os serviços mais citados. Presente em cerca de 25% das vagas.

No Brasil, muitos profissionais de dados nunca trabalharam diretamente com cloud. Usam ferramentas locais ou acessam serviços cloud configurados por times de infra. No mercado internacional, espera-se que o profissional de dados saiba provisionar, configurar e operar recursos cloud diretamente.

O Modern Data Stack: as ferramentas que dominam

O conceito de Modern Data Stack (MDS) se consolidou como o padrão do mercado internacional. São ferramentas especializadas que se integram entre si, cada uma resolvendo uma parte específica do pipeline de dados.

Snowflake

O Snowflake se tornou o data warehouse mais desejado do mercado internacional. Presente em mais de 40% das vagas de Data Engineer nos EUA (dados do Burtch Works, 2025), ele é valorizado pela arquitetura de separação de compute e storage, facilidade de uso e performance.

Se você trabalha com dados e quer o mercado internacional, Snowflake não é opcional. É essencial.

Databricks

O Databricks ocupa uma posição única: é tanto um lakehouse quanto uma plataforma de data engineering e data science. Com a ascensão do conceito de lakehouse architecture, Databricks aparece em aproximadamente 35% das vagas internacionais de dados.

A plataforma é particularmente comum em empresas que lidam com grandes volumes de dados e precisam de processamento distribuído. Delta Lake, Unity Catalog e Databricks SQL aparecem cada vez mais nos job descriptions.

dbt (data build tool)

O dbt mudou a forma como transformações de dados são feitas. Em vez de ETL tradicional, o dbt segue o conceito de ELT (Extract, Load, Transform), onde as transformações acontecem diretamente no warehouse usando SQL.

Segundo a pesquisa do dbt Labs, mais de 30.000 empresas no mundo já usam dbt. Para vagas de Analytics Engineer, um dos cargos que mais crescem internacionalmente, dbt é praticamente obrigatório.

Apache Airflow

O Airflow continua sendo o orquestrador de pipelines mais popular do mercado. Alternativas como Dagster e Prefect estão crescendo, mas o Airflow ainda aparece em mais de 50% das vagas de Data Engineer que mencionam orquestração.

Saber escrever DAGs, configurar tasks, lidar com retries e monitorar pipelines no Airflow é uma skill que recrutadores internacionais esperam de qualquer Data Engineer mid-level ou acima.

Apache Spark

Para processamento de dados em larga escala, Spark continua imbatível. Seja via Databricks, EMR ou Dataproc, a capacidade de processar terabytes de dados com PySpark é um diferencial competitivo real.

O mercado internacional espera proficiência em PySpark, não apenas em Spark com Scala. A consolidação de Python como linguagem dominante em data engineering fez do PySpark a interface padrão.

Stack por role: o que cada cargo exige

As exigências de stack variam bastante entre os diferentes cargos de dados. Saber essas diferenças ajuda a focar seus estudos.

Data Engineer

O cargo mais demandado internacionalmente para brasileiros. A stack típica:

  • Linguagens: Python (PySpark), SQL, bash
  • Orquestração: Airflow, Dagster
  • Processamento: Spark, Flink (menos comum mas crescendo)
  • Warehouse/Lakehouse: Snowflake, Databricks, BigQuery, Redshift
  • Transformação: dbt
  • Infra: Docker, Kubernetes, Terraform (básico)
  • Cloud: AWS ou GCP (pelo menos um, idealmente dois)

Analytics Engineer

Um cargo que quase não existe no Brasil, mas é um dos que mais crescem lá fora:

  • Linguagens: SQL (avançado), Python (intermediário)
  • Transformação: dbt (obrigatório)
  • Warehouse: Snowflake ou BigQuery
  • BI: Looker, Mode, Lightdash
  • Versionamento: Git (com PR reviews e CI/CD para dbt)

Data Scientist

Para cientistas de dados, a stack internacional tende a ser mais diversa, mas alguns padrões aparecem com frequência:

  • Linguagens: Python (scikit-learn, pandas, PyTorch/TensorFlow), R (menos comum que antes)
  • Plataformas: Databricks, SageMaker, Vertex AI
  • Experimentação: MLflow, Weights & Biases
  • Deploy: Docker, APIs com FastAPI/Flask
  • Feature stores: Feast, Tecton

O que os job descriptions realmente pedem

Analisar job descriptions reais é mais útil do que qualquer pesquisa de mercado. Nos últimos 12 meses, eu analisei centenas de vagas internacionais de dados. Alguns padrões:

"Experience with cloud-native data platforms" aparece em 9 de cada 10 vagas. Não basta saber SQL. Você precisa saber SQL dentro de um Snowflake, BigQuery ou Redshift.

"Infrastructure as Code" aparece em cerca de 40% das vagas de Data Engineer senior. Terraform é a ferramenta dominante, seguida de Pulumi.

"CI/CD for data pipelines" está se tornando padrão. Saber configurar GitHub Actions ou GitLab CI para testar e deployar pipelines não é mais diferencial, é expectativa.

"Data modeling" continua sendo cobrado com força. Kimball, Data Vault e modelos activity schema aparecem com frequência. O mercado internacional valoriza modelagem muito mais do que o brasileiro.

Certificações: quais valem a pena?

O mercado internacional de dados não é tão orientado a certificações quanto o de infraestrutura/DevOps. Mas algumas tem valor real:

  • AWS Certified Data Engineer - Associate: a mais reconhecida para quem trabalha com AWS
  • Databricks Certified Data Engineer Associate/Professional: relevante dado o crescimento do Databricks
  • Google Cloud Professional Data Engineer: boa para quem foca em GCP
  • dbt Analytics Engineering Certification: valorizada para roles de Analytics Engineer
  • Snowflake SnowPro Core: boa porta de entrada para mostrar conhecimento em Snowflake

O que não vale tanto a pena: certificações de ferramentas on-premise, certificações de BI (a maioria dos recrutadores internacionais não liga tanto), e certificações genéricas de "big data" que não mostram proficiência prática.

Onde focar: uma abordagem prática

Com tantas ferramentas, a pergunta natural é: por onde começar?

A resposta depende do seu perfil atual, do cargo que você quer e do seu timeline. Mas alguns princípios se aplicam:

  1. Cloud first: se você não trabalha com cloud ainda, esse é o investimento de maior retorno. Escolha AWS ou GCP e vá fundo.
  2. SQL avançado: o mercado internacional exige SQL em um nível que a maioria dos profissionais brasileiros subestima. Window functions, CTEs recursivas, query optimization. Tudo isso é cobrado em entrevistas.
  3. Uma ferramenta de cada camada: um warehouse (Snowflake ou BigQuery), um orquestrador (Airflow), uma ferramenta de transformação (dbt). Isso te cobre para a maioria das vagas.
  4. Python para dados: não precisa ser um software engineer, mas precisa saber PySpark, pandas e scripting de automação.

A armadilha é tentar aprender tudo ao mesmo tempo. Melhor ter profundidade nas ferramentas certas, na ordem certa.


Na Dados na Gringa, ajudamos profissionais de dados brasileiros a identificar quais gaps de stack precisam fechar para se tornarem competitivos internacionalmente. Não existe fórmula genérica. O plano de estudo precisa ser personalizado para o seu perfil, o cargo que você busca e o mercado que você quer atingir.

Quer acelerar sua transição para a gringa?

Faça o diagnóstico gratuito e descubra seu nível de prontidão para o mercado internacional de dados.

Fazer diagnóstico gratuito