Identificação de Estrelas de Nêutrons Pulsares

Identificação de Estrelas de Nêutrons Pulsares

Conheça o projeto

Neste desafio, você atuará como cientista de dados, com a missão de identificar estrelas de nêutrons pulsares reais a partir de observações astronômicas captadas por radiotelescópios. O contexto envolve a aplicação de técnicas de classificação para diferenciar pulsares de outras fontes astrofísicas ou ruído, utilizando dados estatísticos extraídos de sinais de rádio.

Recursos

Materiais para você usar como base para o desenvolvimento

Instruções

Estrutura, regras e requisitos do projeto

O objetivo é treinar um modelo de regressão logística para classificar corretamente as observações como pulsares ou não-pulsares, utilizando apenas os atributos fornecidos. O arquivo de dados está disponível em pulsar.csv.


Descrição do Dataset

O dataset é composto por 17.898 observações, cada uma representando medições estatísticas de sinais obtidos por radiotelescópios. Abaixo estão os oito atributos disponíveis:

  1. Mean of the integrated profileMédia do perfil integrado do sinal, que representa a média da intensidade do sinal ao longo do tempo.
  2. Standard deviation of the integrated profileDesvio padrão do perfil integrado, indicando a variação da intensidade em torno da média.
  3. Excess kurtosis of the integrated profileCurtose excessiva do perfil integrado, que mede a "cauda" da distribuição do sinal em relação a uma distribuição normal.
  4. Skewness of the integrated profileAssimetria do perfil integrado, representando o grau de distorção da distribuição do sinal em torno da média.
  5. Mean of the DM-SNR curveMédia da curva DM-SNR (medida da razão sinal-ruído em função da dispersão), que quantifica a intensidade média do sinal ajustado por diferentes dispersões.
  6. Standard deviation of the DM-SNR curveDesvio padrão da curva DM-SNR, indicando a variabilidade da razão sinal-ruído em diferentes dispersões.
  7. Excess kurtosis of the DM-SNR curveCurtose excessiva da curva DM-SNR, avaliando a presença de picos extremos na distribuição da razão sinal-ruído.
  8. Skewness of the DM-SNR curveAssimetria da curva DM-SNR, que mostra a inclinação da distribuição da razão sinal-ruído em relação à média.
  9. target_classClasse alvo binária que indica o tipo de objeto:
    • 1: Pulsares reais (estrelas de nêutrons altamente magnetizadas)
    • 0: Não-pulsares (ruído ou outras fontes astrofísicas)

Observação

O dataset se encontra compactado na seção de recursos, é necessário extrair primeiro.


Entrega

Após concluir o desafio, você deve enviar a URL do seu código no GitHub para a plataforma.

Além disso, que tal fazer um post no LinkedIn compartilhando o seu aprendizado e contando como foi a experiência?

É uma excelente forma de demonstrar seus conhecimentos e atrair novas oportunidades!

Feito com 💜 por Rocketseat 👋

Tarefas

Use este checklist para ajudar a organizar a sua entrega

Resolução

Confira os resultados esperados do projeto

Paywall background

Envie o projeto para ver a resolução

Ao enviar seu projeto, você poderá conferir os resultados esperados

Projetos relacionados