Conheça o projeto
Sua missão é criar uma análise exploratória completa, treinar modelos preditivos e interpretar os resultados para gerar insights acionáveis.
Recursos
Materiais para você usar como base para o desenvolvimento
Instruções
Estrutura, regras e requisitos do projeto
Faaala, Dev! 💜
Chegou a hora de colocar em prática tudo o que aprendemos sobre análise de dados e Machine Learning.
Neste desafio, você vai explorar um cenário realista do mercado de tecnologia: a previsão de churn em um produto SaaS (Software as a Service).
Seu objetivo será entender quais fatores influenciam o cancelamento de clientes e construir um modelo de Machine Learning capaz de prever quem está mais propenso a cancelar.
Mais do que um exercício técnico, este desafio é sobre usar dados para tomar decisões inteligentes de negócio. 🚀
📦 Contexto
Você faz parte do time de dados da TechGrow, uma empresa SaaS que oferece soluções de gestão para pequenos negócios.
Nos últimos meses, a liderança percebeu um aumento preocupante na taxa de cancelamento (churn).
O time de produto quer descobrir por que isso está acontecendo e quais clientes estão em risco.
Você recebeu um conjunto de dados com informações de clientes, uso da plataforma e histórico de faturamento.
Sua missão é criar uma análise exploratória completa, treinar modelos preditivos e interpretar os resultados para gerar insights acionáveis.
🧩 Desafio
- Importe e explore os dados
- Carregue o arquivo
Caso_Pratico_base_churn_saas.csv. - Observe o formato, colunas disponíveis e tipos de variáveis.
- Verifique valores nulos e estatísticas descritivas.
- Crie visualizações para entender a distribuição das variáveis e o comportamento dos clientes que cancelaram (
churn == 1).
- Carregue o arquivo
- Trate e prepare os dados
- Aplique encoding em variáveis categóricas.
- Padronize ou normalize as colunas numéricas, se necessário.
- Verifique correlações relevantes e elimine colunas redundantes.
- Separe os dados em treino e teste
- Utilize 70% para treino e 30% para teste.
- Defina
churncomo variável-alvo (target).
- Treine os modelos
- Comece com um modelo baseline: Regressão Logística.
- Em seguida, treine e compare com Random Forest e XGBoost.
- Avalie os resultados
- Use métricas de classificação:
accuracyprecisionrecallf1-scoreroc_auc_score
- Plote a matriz de confusão e a curva ROC.
- Use métricas de classificação:
- Interprete e apresente os resultados
- Quais variáveis mais impactam o churn?
- Seu modelo consegue identificar bem os clientes que vão cancelar?
- Quais ações você recomendaria ao time de produto?
🧠 O que você vai praticar
- Análise exploratória e preparação de dados
- Criação de modelos supervisionados de classificação
- Avaliação de performance de modelos
- Interpretação de resultados e storytelling com dados
💜 Dica da Rocketseat
O foco deste desafio não é apenas encontrar o modelo com melhor acurácia, mas entender o porquê.
Explique suas decisões, documente suas observações e interprete o impacto de cada variável.
Pense como uma pessoa de dados que ajuda o time a tomar decisões baseadas em evidências. ✨
📂 Dataset
Arquivo: Caso_Pratico_base_churn_saas.csv
Contém colunas relacionadas a:
- Perfil do cliente (tempo de contrato, localização, tipo de plano)
- Comportamento de uso (número de logins, volume de ações, tickets de suporte)
- Histórico financeiro (valor mensal, inadimplência, descontos aplicados)
- Variável alvo:
churn(1 = cancelou, 0 = manteve o serviço)
Entrega
Após concluir o desafio, você deve enviar a URL do seu código no GitHub para a plataforma.
Além disso, que tal fazer um post no LinkedIn compartilhando o seu aprendizado e contando como foi a experiência?
É uma excelente forma de demonstrar seus conhecimentos e atrair novas oportunidades!
Feito com 💜 por Rocketseat 👋
Faaala, Dev! 💜
Chegou a hora de colocar em prática tudo o que aprendemos sobre análise de dados e Machine Learning.
Neste desafio, você vai explorar um cenário realista do mercado de tecnologia: a previsão de churn em um produto SaaS (Software as a Service).
Seu objetivo será entender quais fatores influenciam o cancelamento de clientes e construir um modelo de Machine Learning capaz de prever quem está mais propenso a cancelar.
Mais do que um exercício técnico, este desafio é sobre usar dados para tomar decisões inteligentes de negócio. 🚀
📦 Contexto
Você faz parte do time de dados da TechGrow, uma empresa SaaS que oferece soluções de gestão para pequenos negócios.
Nos últimos meses, a liderança percebeu um aumento preocupante na taxa de cancelamento (churn).
O time de produto quer descobrir por que isso está acontecendo e quais clientes estão em risco.
Você recebeu um conjunto de dados com informações de clientes, uso da plataforma e histórico de faturamento.
Sua missão é criar uma análise exploratória completa, treinar modelos preditivos e interpretar os resultados para gerar insights acionáveis.
🧩 Desafio
- Importe e explore os dados
- Carregue o arquivo
Caso_Pratico_base_churn_saas.csv. - Observe o formato, colunas disponíveis e tipos de variáveis.
- Verifique valores nulos e estatísticas descritivas.
- Crie visualizações para entender a distribuição das variáveis e o comportamento dos clientes que cancelaram (
churn == 1).
- Carregue o arquivo
- Trate e prepare os dados
- Aplique encoding em variáveis categóricas.
- Padronize ou normalize as colunas numéricas, se necessário.
- Verifique correlações relevantes e elimine colunas redundantes.
- Separe os dados em treino e teste
- Utilize 70% para treino e 30% para teste.
- Defina
churncomo variável-alvo (target).
- Treine os modelos
- Comece com um modelo baseline: Regressão Logística.
- Em seguida, treine e compare com Random Forest e XGBoost.
- Avalie os resultados
- Use métricas de classificação:
accuracyprecisionrecallf1-scoreroc_auc_score
- Plote a matriz de confusão e a curva ROC.
- Use métricas de classificação:
- Interprete e apresente os resultados
- Quais variáveis mais impactam o churn?
- Seu modelo consegue identificar bem os clientes que vão cancelar?
- Quais ações você recomendaria ao time de produto?
🧠 O que você vai praticar
- Análise exploratória e preparação de dados
- Criação de modelos supervisionados de classificação
- Avaliação de performance de modelos
- Interpretação de resultados e storytelling com dados
💜 Dica da Rocketseat
O foco deste desafio não é apenas encontrar o modelo com melhor acurácia, mas entender o porquê.
Explique suas decisões, documente suas observações e interprete o impacto de cada variável.
Pense como uma pessoa de dados que ajuda o time a tomar decisões baseadas em evidências. ✨
📂 Dataset
Arquivo: Caso_Pratico_base_churn_saas.csv
Contém colunas relacionadas a:
- Perfil do cliente (tempo de contrato, localização, tipo de plano)
- Comportamento de uso (número de logins, volume de ações, tickets de suporte)
- Histórico financeiro (valor mensal, inadimplência, descontos aplicados)
- Variável alvo:
churn(1 = cancelou, 0 = manteve o serviço)
Entrega
Após concluir o desafio, você deve enviar a URL do seu código no GitHub para a plataforma.
Além disso, que tal fazer um post no LinkedIn compartilhando o seu aprendizado e contando como foi a experiência?
É uma excelente forma de demonstrar seus conhecimentos e atrair novas oportunidades!
Feito com 💜 por Rocketseat 👋
Tarefas
Use este checklist para ajudar a organizar a sua entrega
Resolução
Confira os resultados esperados do projeto

Envie o projeto para ver a resolução
Ao enviar seu projeto, você poderá conferir os resultados esperados