Construa um modelo de classificação utilizando o algoritmo Random Forest para prever a aprovação de empréstimos, com base no dataset fornecido.
Utilize as 13 variáveis preditoras disponíveis para treinar o modelo e classificar a variável-alvo loan_status, que indica se o empréstimo foi aprovado (1) ou rejeitado (0).
O dataset contém 45.000 registros e 14 variáveis, incluindo informações detalhadas sobre idade, gênero, escolaridade, renda, experiência profissional, situação habitacional, valor e finalidade do empréstimo, taxa de juros, percentual do empréstimo em relação à renda, tempo de histórico de crédito, pontuação de crédito e registros de inadimplência anteriores.
Realize todas as etapas necessárias para preparar os dados, treinar, validar e avaliar o desempenho do modelo, garantindo a utilização adequada das informações disponíveis.
📦 Dataset
Variáveis disponíveis
| Nome da Coluna | Descrição |
|---|
person_age | Idade da pessoa |
person_gender | Gênero da pessoa |
person_education | Nível mais alto de escolaridade alcançado |
person_income | Renda anual da pessoa |
person_emp_exp | Anos de experiência profissional |
person_home_ownership | Situação habitacional da pessoa (por exemplo, aluguel, própria, hipoteca) |
loan_amnt | Valor do empréstimo solicitado |
loan_intent | Finalidade ou objetivo do empréstimo |
loan_int_rate | Taxa de juros do empréstimo |
loan_percent_income | Percentual do valor do empréstimo em relação à renda anual |
cb_person_cred_hist_length | Tempo de histórico de crédito da pessoa, em anos |
credit_score | Pontuação de crédito da pessoa |
previous_loan_defaults_on_file | Indicador se a pessoa possui registros de inadimplência anteriores |
loan_status | Indica se o empréstimo foi aprovado (1) ou rejeitado (0) |
Observação
O dataset se encontra compactado na seção de recursos, é necessário extrair primeiro. Ou você pode baixar no link disponibilizado acima na descrição do Dataset ou na área de recursos.
Entrega
Após concluir o desafio, você deve enviar a URL do seu código no GitHub para a plataforma.
Além disso, que tal fazer um post no LinkedIn compartilhando o seu aprendizado e contando como foi a experiência?
É uma excelente forma de demonstrar seus conhecimentos e atrair novas oportunidades!
Feito com 💜 por Rocketseat 👋
Construa um modelo de classificação utilizando o algoritmo Random Forest para prever a aprovação de empréstimos, com base no dataset fornecido.
Utilize as 13 variáveis preditoras disponíveis para treinar o modelo e classificar a variável-alvo loan_status, que indica se o empréstimo foi aprovado (1) ou rejeitado (0).
O dataset contém 45.000 registros e 14 variáveis, incluindo informações detalhadas sobre idade, gênero, escolaridade, renda, experiência profissional, situação habitacional, valor e finalidade do empréstimo, taxa de juros, percentual do empréstimo em relação à renda, tempo de histórico de crédito, pontuação de crédito e registros de inadimplência anteriores.
Realize todas as etapas necessárias para preparar os dados, treinar, validar e avaliar o desempenho do modelo, garantindo a utilização adequada das informações disponíveis.
📦 Dataset
Variáveis disponíveis
| Nome da Coluna | Descrição |
|---|
person_age | Idade da pessoa |
person_gender | Gênero da pessoa |
person_education | Nível mais alto de escolaridade alcançado |
person_income | Renda anual da pessoa |
person_emp_exp | Anos de experiência profissional |
person_home_ownership | Situação habitacional da pessoa (por exemplo, aluguel, própria, hipoteca) |
loan_amnt | Valor do empréstimo solicitado |
loan_intent | Finalidade ou objetivo do empréstimo |
loan_int_rate | Taxa de juros do empréstimo |
loan_percent_income | Percentual do valor do empréstimo em relação à renda anual |
cb_person_cred_hist_length | Tempo de histórico de crédito da pessoa, em anos |
credit_score | Pontuação de crédito da pessoa |
previous_loan_defaults_on_file | Indicador se a pessoa possui registros de inadimplência anteriores |
loan_status | Indica se o empréstimo foi aprovado (1) ou rejeitado (0) |
Observação
O dataset se encontra compactado na seção de recursos, é necessário extrair primeiro. Ou você pode baixar no link disponibilizado acima na descrição do Dataset ou na área de recursos.
Entrega
Após concluir o desafio, você deve enviar a URL do seu código no GitHub para a plataforma.
Além disso, que tal fazer um post no LinkedIn compartilhando o seu aprendizado e contando como foi a experiência?
É uma excelente forma de demonstrar seus conhecimentos e atrair novas oportunidades!
Feito com 💜 por Rocketseat 👋