- RStudio: Ambiente integrado para desenvolvimento em R, oferecendo ferramentas para escrita, execução e depuração de código.
- Ggplot2: Pacote para criação de visualizações de dados elegantes e flexíveis em R.
- Tidyverse: Conjunto de pacotes para manipulação de dados, visualização e modelagem em R, seguindo o paradigma "tidy data".
- Corrplot: Pacote em R que fornece ferramentas para visualização de matrizes de correlação. Permite criar gráficos de correlação de maneira simples e intuitiva, utilizando diferentes métodos de visualização, como círculos, elipses, quadrados e outras formas, facilitando a análise e interpretação das correlações entre variáveis.
A regressão linear é uma técnica estatística utilizada para modelar a relação entre uma variável dependente 𝑌 e uma ou mais variáveis independentes X. O objetivo é encontrar a melhor linha reta (ou hiperplano, no caso de múltiplas variáveis independentes) que descreve essa relação.A regressão linear é amplamente utilizada em várias áreas, como economia, finanças, ciências sociais, biologia e engenharia, para prever valores, entender relações entre variáveis e tomar decisões baseadas em dados quantitativos.
Definição do Problema: Prever as notas dos alunos com base em diversas métricas.
- Variável target: G3 (Trata-se da nota final do aluno no último estágio)
Fonte de Dados e dicionário: https://archive.ics.uci.edu/ml/datasets/Student+Performance
Referências: Formação Cientista de Dados (https://www.datascienceacademy.com.br/)