Skip to content
View gustavocrod's full-sized avatar
🎯
Focusing
🎯
Focusing

Block or report gustavocrod

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don't include any personal information such as legal names or email addresses. Markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
gustavocrod/README.MD

Typing SVG

Gustavo "cr0d" Rodrigues

Senior Data Engineer | Python & SQL Spark | Databricks

Sou Data Engineer com forte atuação em Analytics Engineering, especializado em estruturar plataformas de dados críticas para o negócio, conectando decisões estratégicas a dados confiáveis e bem modelados. Minha principal força está na interface entre negócio e dados. Trabalho próximo a stakeholders para entender profundamente os problemas operacionais, traduzindo necessidades estratégicas em modelagens claras e pipelines robustos que sustentam análises, produto e decisões em larga escala. Tenho experiência prática na construção e evolução de plataformas modernas de dados, atuando em domínios como marketing, logística e dados financeiros, sempre com foco em governança, rastreabilidade e impacto direto na tomada de decisão.

GIF

Linkedin Badge Gmail Badge

Olá pessoa (ou 🤖) 👋;

Atualmente sou Senior Data Engineer no iFood. Trabalho com pySpark, em ambiente Databricks + Airflow + Python, implementando Data Vault 2.0.

📈 Trabalhei em um projeto de Ciência de dados sobre COVID-19. O objtivo é prever a chance de óbito de pacientes com COVID-19 no estado do Rio Grande do Sul (Brasil).

🔥 Tópicos de interesse: Possuo interesse nas áreas de Engenharia de Dados, Ciência de Dados e Aprendizagem de Máquina com Python (scikit-learn, numpy, matplotlib, pandas); Desenvolvimento de Jogos Digitais (Unity); e Segurança da Informação.

✔️ Sinta-se a vontade para me seguir para ver alguns projetos de Data Engineering e Data Science ou para mandar uma mensagem para conversarmos sobre tópicos aleatórios;

Projetos 📁:

🧱 Data Engineering ⚙️

🚧 O projeto

Esse é um projeto de data engineering utilizando arquitetura medallion com databricks. Aqui focamos em aplicar conceitos de Delta Lake House, aquisição, limpeza e modelagem de dados.

  • 🛒 Project Supermarket sales: O conjunto de dados é um registros histórico de vendas de uma empresa de supermercados (ficticio), que foi registrado em 3 filiais diferentes ao longo de 3 meses em 2019. Projeto simples onde a camada silver contém apenas 1 tabela.

  • 🚛 Project Ecommerce olist: Projeto mais robusto que permite análises mais elaboradas sobre os dados. Este é um conjunto de dados públicos de comércio eletrônico brasileiro das compras feitas na loja Olist. O conjunto de dados contém informações de 100 mil pedidos de 2016 a 2018 feitos em vários marketplaces no Brasil. Suas características permitem visualizar um pedido em várias dimensões: desde o status do pedido, preço, pagamento e desempenho de frete até a localização do cliente, atributos do produto e, finalmente, avaliações escritas pelos clientes. Também disponibilizamos um conjunto de dados de geolocalização que relaciona os códigos postais brasileiros às coordenadas lat/long.

📈 Data Science

🚧 O repositório: Não clicke aqui :trollface:

Titanic: Machine Leaning from Disaster 🚢

  • Exploração do 'Hello World' de Data Science:
    • Visualização de correlações entre:
      • Sexo e probabilidade de viver;
      • Idade e probabilidade de viver;
      • Local de embarque e probabilidade de viver;
    • Modelo preditivo sobre "teria vivivo ou não ao desastre?".

As cidades universitárias (EUA) têm seus os preços médios de residências menos afetados durante recessões? 🏠 💵

  • Análise sobre os preços das residências dos EUA;
  • Compração dos preços das residências em cidades normais vs preços das residências em cidades universitárias;
  • Validação da hipotese sobre as cidades universitárias terem os preços menos afetados utilizando um Teste T de Student.

Recordes Metereológicos de 2005 a 2014 quebrados em 2015 - Região de Ann Arbor, Michigan ☀️ 🌡️ ❄️

  • Análise temporal sobre as temperaturas e recordes de temperatura no período de 2005 a 2014 em Ann Arbor, Michigan.
  • Visualização dos recordes metereológicos deste período, que foram quebrados no ano de 2015, também nessa região.
    • Utilização do matplotlib

Análise exploratória dos dados de ligações de emergência - 911, em 2016 - Região do Condado de Montgomery, Condado na Pensilvânia 🚓 🚑 🚒

  • Análise exploratória utilizando PyData Stack
  • Visualização dos picos de horários onde mais ocorreram ligações de emergência, sendo de tráfego, saúde ou incêndio.
    • Utilização do Seaborn

Regressão linear para ajudar na tomada de decisão. Devo investir mais no App mobile ou no website? (Cenário fictício) 📱 vs 💻

  • Análise exploratória com PyData Stack
  • Implementação de um modelo de Machine Learning (LinearRegression) com o sklearn

Data Scraping and Data viz - What's the Biggest Soccer Club of Rio Grande do Sul/Brazil - According to the Number of Championships Won (From birth to 2019) 🔴⚪ VS 🔵⚫

  • Extração de dados da Wikipedia
  • Análise exploratória com PyData Stack
  • Visualização dos títulos expressivos ganhos no Sul, Brasil e América
    • Títulos totais e contatem por título
    • Utilização do Seaborn
  • INTER É O MAIOR DO SUL PAI. É US GURI

Análise dos dados do Airbnb Boston, Massachusetts ✈️ 🏨

  • Análise sobre distribuição dos preços
  • Detecção de outliers
  • Locais mais caros

Pinned Loading

  1. databricks-data-engineering databricks-data-engineering Public

    Data engineering on databricks

    Jupyter Notebook

  2. Data-Science Data-Science Public

    Jupyter Notebook 6

  3. vrp vrp Public

    Implementação dos algoritmos: Clarke e Wright Savings, e Monte Carlo Savings aplicado no CeWSavings, para o problema de roteamento de veículos capacitados

    Python 1 1

  4. XQDLteam/planet-hulk XQDLteam/planet-hulk Public

    Planet hulk is an ambient to test HTTP servers, without and with charge stress.

    Python 1 1

  5. genetic-algorithm-tweet-clusters genetic-algorithm-tweet-clusters Public

    task: criar cluster de tweets utilizando levenshtein e jaccard coefficient

    Python

  6. maxbot maxbot Public

    (M)etereologista (A)utomatizado X, um chatbot que informa a temperatura atual de uma localização e também a previsão para uma semana deste local.

    Python