Aplique o algoritmo PCA para reduzir a dimensionalidade dos dados, buscando manter o máximo de informação possível. Após a redução, facilite a visualização e análise dos dados transformados. Calcule o erro de reconstrução do dataset a partir dos componentes principais selecionados.
Dataset
Utilize o dataset housing.csv, que contém dados sobre casas, incluindo preço, área, número de quartos, banheiros, andares, características como acesso à rua principal, presença de quarto de hóspedes, porão, aquecimento de água, ar-condicionado, vagas de estacionamento, localização em área preferencial e status de mobília (furnished, semi-furnished, unfurnished).
Colunas do Dataset
- price: Preço da casa.
- area: Área construída da casa (em pés quadrados).
- bedrooms: Número de quartos.
- bathrooms: Número de banheiros.
- stories: Número de andares (pavimentos).
- mainroad: Acesso à rua principal (
yes = possui acesso, no = não possui).
- guestroom: Possui quarto de hóspedes (
yes = possui, no = não possui).
- basement: Possui porão (
yes = possui, no = não possui).
- hotwaterheating: Possui aquecimento de água (
yes = possui, no = não possui).
- airconditioning: Possui ar-condicionado (
yes = possui, no = não possui).
- parking: Número de vagas de estacionamento.
- prefarea: Localizada em área preferencial (
yes = sim, no = não).
- furnishingstatus: Status de mobília da casa:
- furnished: Casa totalmente mobiliada, pronta para morar, incluindo móveis essenciais como camas, sofás, armários, eletrodomésticos, etc.
- semi-furnished: Casa parcialmente mobiliada, com alguns móveis ou itens básicos, mas não completamente equipada.
- unfurnished: Casa sem mobília, entregue vazia, sem móveis ou eletrodomésticos.
Dica: O PCA é uma ferramenta poderosa para eliminar redundâncias, facilitar a visualização e destacar os fatores mais relevantes em datasets com muitos atributos correlacionados.
Observação
O dataset se encontra compactado na seção de recursos, é necessário extrair primeiro.
Entrega
Após concluir o desafio, você deve enviar a URL do seu código no GitHub para a plataforma.
Além disso, que tal fazer um post no LinkedIn compartilhando o seu aprendizado e contando como foi a experiência?
É uma excelente forma de demonstrar seus conhecimentos e atrair novas oportunidades!
Feito com 💜 por Rocketseat 👋
Aplique o algoritmo PCA para reduzir a dimensionalidade dos dados, buscando manter o máximo de informação possível. Após a redução, facilite a visualização e análise dos dados transformados. Calcule o erro de reconstrução do dataset a partir dos componentes principais selecionados.
Dataset
Utilize o dataset housing.csv, que contém dados sobre casas, incluindo preço, área, número de quartos, banheiros, andares, características como acesso à rua principal, presença de quarto de hóspedes, porão, aquecimento de água, ar-condicionado, vagas de estacionamento, localização em área preferencial e status de mobília (furnished, semi-furnished, unfurnished).
Colunas do Dataset
- price: Preço da casa.
- area: Área construída da casa (em pés quadrados).
- bedrooms: Número de quartos.
- bathrooms: Número de banheiros.
- stories: Número de andares (pavimentos).
- mainroad: Acesso à rua principal (
yes = possui acesso, no = não possui).
- guestroom: Possui quarto de hóspedes (
yes = possui, no = não possui).
- basement: Possui porão (
yes = possui, no = não possui).
- hotwaterheating: Possui aquecimento de água (
yes = possui, no = não possui).
- airconditioning: Possui ar-condicionado (
yes = possui, no = não possui).
- parking: Número de vagas de estacionamento.
- prefarea: Localizada em área preferencial (
yes = sim, no = não).
- furnishingstatus: Status de mobília da casa:
- furnished: Casa totalmente mobiliada, pronta para morar, incluindo móveis essenciais como camas, sofás, armários, eletrodomésticos, etc.
- semi-furnished: Casa parcialmente mobiliada, com alguns móveis ou itens básicos, mas não completamente equipada.
- unfurnished: Casa sem mobília, entregue vazia, sem móveis ou eletrodomésticos.
Dica: O PCA é uma ferramenta poderosa para eliminar redundâncias, facilitar a visualização e destacar os fatores mais relevantes em datasets com muitos atributos correlacionados.
Observação
O dataset se encontra compactado na seção de recursos, é necessário extrair primeiro.
Entrega
Após concluir o desafio, você deve enviar a URL do seu código no GitHub para a plataforma.
Além disso, que tal fazer um post no LinkedIn compartilhando o seu aprendizado e contando como foi a experiência?
É uma excelente forma de demonstrar seus conhecimentos e atrair novas oportunidades!
Feito com 💜 por Rocketseat 👋