Clusterização do Iris Dataset

Conheça o projeto

Este desafio propõe a aplicação de técnicas de aprendizado não supervisionado para explorar agrupamentos no famoso conjunto de dados Iris. O objetivo é incentivar a compreensão prática de algoritmos de clustering.

Instruções

Estrutura, regras e requisitos do projeto

Utilize o algoritmo K-Means para agrupar as amostras do conjunto de dados Iris, otimizando os hiperparâmetros do modelo com o auxílio da biblioteca Optuna. O dataset Iris possui 150 amostras de flores, divididas em três espécies (Setosa, Versicolor e Virginica), cada uma descrita por quatro atributos numéricos:

  • Comprimento da sépala (sepal length)
  • Largura da sépala (sepal width)
  • Comprimento da pétala (petal length)
  • Largura da pétala (petal width)

Target:

  • 0: setosa
  • 1: versicolor
  • 2: virginica

Código Base

Você pode importar o dataset diretamente do scikit-learn com o seguinte código:

from sklearn.datasets import load_iris iris = load_iris() X = iris.data # Atributos das flores y = iris.target # Classes reais (usadas apenas para avaliação)

Entrega

Após concluir o desafio, você deve enviar a URL do seu código no GitHub para a plataforma.

Além disso, que tal fazer um post no LinkedIn compartilhando o seu aprendizado e contando como foi a experiência?

É uma excelente forma de demonstrar seus conhecimentos e atrair novas oportunidades!

Feito com 💜 por Rocketseat 👋

Tarefas

Use este checklist para ajudar a organizar a sua entrega

Resolução

Confira os resultados esperados do projeto

Paywall background

Envie o projeto para ver a resolução

Ao enviar seu projeto, você poderá conferir os resultados esperados

Projetos relacionados