Explorando Dimensões: Redução com PCA

Conheça o projeto

Este desafio propõe a aplicação do algoritmo PCA (Análise de Componentes Principais) no dataset housing.csv, que reúne informações detalhadas sobre casas e seus preços. O objetivo é explorar técnicas de redução de dimensionalidade para facilitar a análise e visualização dos dados, além de compreender como os principais fatores influenciam o conjunto de atributos disponíveis.

Recursos

Materiais para você usar como base para o desenvolvimento

Instruções

Estrutura, regras e requisitos do projeto

Aplique o algoritmo PCA para reduzir a dimensionalidade dos dados, buscando manter o máximo de informação possível. Após a redução, facilite a visualização e análise dos dados transformados. Calcule o erro de reconstrução do dataset a partir dos componentes principais selecionados.


Dataset

Utilize o dataset housing.csv, que contém dados sobre casas, incluindo preço, área, número de quartos, banheiros, andares, características como acesso à rua principal, presença de quarto de hóspedes, porão, aquecimento de água, ar-condicionado, vagas de estacionamento, localização em área preferencial e status de mobília (furnished, semi-furnished, unfurnished).

Colunas do Dataset

  • price: Preço da casa.
  • area: Área construída da casa (em pés quadrados).
  • bedrooms: Número de quartos.
  • bathrooms: Número de banheiros.
  • stories: Número de andares (pavimentos).
  • mainroad: Acesso à rua principal (yes = possui acesso, no = não possui).
  • guestroom: Possui quarto de hóspedes (yes = possui, no = não possui).
  • basement: Possui porão (yes = possui, no = não possui).
  • hotwaterheating: Possui aquecimento de água (yes = possui, no = não possui).
  • airconditioning: Possui ar-condicionado (yes = possui, no = não possui).
  • parking: Número de vagas de estacionamento.
  • prefarea: Localizada em área preferencial (yes = sim, no = não).
  • furnishingstatus: Status de mobília da casa:
    • furnished: Casa totalmente mobiliada, pronta para morar, incluindo móveis essenciais como camas, sofás, armários, eletrodomésticos, etc.
    • semi-furnished: Casa parcialmente mobiliada, com alguns móveis ou itens básicos, mas não completamente equipada.
    • unfurnished: Casa sem mobília, entregue vazia, sem móveis ou eletrodomésticos.

Dica: O PCA é uma ferramenta poderosa para eliminar redundâncias, facilitar a visualização e destacar os fatores mais relevantes em datasets com muitos atributos correlacionados.


Observação

O dataset se encontra compactado na seção de recursos, é necessário extrair primeiro.


Entrega

Após concluir o desafio, você deve enviar a URL do seu código no GitHub para a plataforma.

Além disso, que tal fazer um post no LinkedIn compartilhando o seu aprendizado e contando como foi a experiência?

É uma excelente forma de demonstrar seus conhecimentos e atrair novas oportunidades!

Feito com 💜 por Rocketseat 👋

Tarefas

Use este checklist para ajudar a organizar a sua entrega

Resolução

Confira os resultados esperados do projeto

Paywall background

Envie o projeto para ver a resolução

Ao enviar seu projeto, você poderá conferir os resultados esperados

Projetos relacionados