Implemente um modelo de classificação multirrótulo utilizando o algoritmo CatBoostClassifier, treinando-o com o dataset fornecido, que contém 2000 registros de filmes.
Dataset
Cada registro apresenta informações detalhadas, incluindo duração, quantidade de membros no elenco, presença de estrelas conhecidas, número de explosões, estilo musical, fama do diretor, densidade de diálogos, presença de cenas românticas, nível de humor e nível de violência.
Os gêneros a serem previstos são ação, comédia e romance, podendo coexistir em um mesmo filme.
Utilize todas as features disponíveis para treinar o modelo, sem descartar nenhuma informação relevante do dataset.
Features
| Coluna | Tipo | Descrição |
|---|
duration_minutes | Numérico | Duração do filme em minutos |
cast_count | Numérico | Quantidade de membros no elenco |
has_superstars | Binário | 1 se há estrelas conhecidas no elenco |
explosions_count | Numérico | Quantidade de cenas com explosões |
music_style | Categórico | Tipo da trilha sonora (orchestral, pop, etc.) |
director_fame | Categórico | Fama do diretor (low, medium, high) |
dialogue_density | Numérico | Número médio de falas por minuto |
has_romantic_scene | Binário | 1 se o filme contém cenas românticas |
humor_level | Numérico | Nível de humor (0 a 10) |
violence_level | Numérico | Nível de violência (0 a 10) |
Targets
| Coluna | Tipo | Descrição |
|---|
is_action | Binário | 1 se é um filme de ação |
is_comedy | Binário | 1 se é um filme de comédia |
is_romance | Binário | 1 se é um filme de romance |
Observação
O dataset se encontra compactado na seção de recursos, é necessário extrair primeiro.
Entrega
Após concluir o desafio, você deve enviar a URL do seu código no GitHub para a plataforma.
Além disso, que tal fazer um post no LinkedIn compartilhando o seu aprendizado e contando como foi a experiência?
É uma excelente forma de demonstrar seus conhecimentos e atrair novas oportunidades!
Feito com 💜 por Rocketseat 👋
Implemente um modelo de classificação multirrótulo utilizando o algoritmo CatBoostClassifier, treinando-o com o dataset fornecido, que contém 2000 registros de filmes.
Dataset
Cada registro apresenta informações detalhadas, incluindo duração, quantidade de membros no elenco, presença de estrelas conhecidas, número de explosões, estilo musical, fama do diretor, densidade de diálogos, presença de cenas românticas, nível de humor e nível de violência.
Os gêneros a serem previstos são ação, comédia e romance, podendo coexistir em um mesmo filme.
Utilize todas as features disponíveis para treinar o modelo, sem descartar nenhuma informação relevante do dataset.
Features
| Coluna | Tipo | Descrição |
|---|
duration_minutes | Numérico | Duração do filme em minutos |
cast_count | Numérico | Quantidade de membros no elenco |
has_superstars | Binário | 1 se há estrelas conhecidas no elenco |
explosions_count | Numérico | Quantidade de cenas com explosões |
music_style | Categórico | Tipo da trilha sonora (orchestral, pop, etc.) |
director_fame | Categórico | Fama do diretor (low, medium, high) |
dialogue_density | Numérico | Número médio de falas por minuto |
has_romantic_scene | Binário | 1 se o filme contém cenas românticas |
humor_level | Numérico | Nível de humor (0 a 10) |
violence_level | Numérico | Nível de violência (0 a 10) |
Targets
| Coluna | Tipo | Descrição |
|---|
is_action | Binário | 1 se é um filme de ação |
is_comedy | Binário | 1 se é um filme de comédia |
is_romance | Binário | 1 se é um filme de romance |
Observação
O dataset se encontra compactado na seção de recursos, é necessário extrair primeiro.
Entrega
Após concluir o desafio, você deve enviar a URL do seu código no GitHub para a plataforma.
Além disso, que tal fazer um post no LinkedIn compartilhando o seu aprendizado e contando como foi a experiência?
É uma excelente forma de demonstrar seus conhecimentos e atrair novas oportunidades!
Feito com 💜 por Rocketseat 👋