Objetivo: El curso se centra en adquirir, formatear y analizar datos utilizando los paquetes que contiene R, aplicandolos en la realización de un análisis exploratorio utilizando herramientas y algoritmos para llevar a cabo clasificaciones y aplicaciones de modelos de datos, encontrar información útil entre una cantidad basta de información, con los cuales posteriormente podamos generar reportes que puedan expresar correctamente nuestro análisis.
Primero revisaremos la visualización de los datos con la biblioteca de ggplot2, donde empezaremos a ver como extraer nuestros datos de un csv y pasarlos a un dataframe, se verá como empezar a interpretar nuestros datos.
En esta primera sección se utilizarán las siguientes biblitecas:
- ggplot2
- tidyverse
En la segunda sección se revisará algunos comandos básicos para la implementación de operaciones en R, tambien se verá como es la estructura de las funciones en R y cómo tienen que ser llamadas adecuadamente, por ultimo se veran algunas recomendaciones de como nombrar nuestos conjuntos de datos para su adecuado manejo dentro de funciones o sentencias que nosotros estemos programando para el análisis de su contenido.
En la tercera sección veremos como puedes hacer trasformaciones entre los diferentes tipos de datos que nos podemos encontrar en un csv. Veremos como abordar un conjunto de datos/dataset, en donde se nos pueden presentar inconsistencias, desordenamiento, redundancias, entre otras cosas dentro del mismo conjunto de datos y daremos particularmente como se pueden resolver estos casos.
Para esta sección se uitlizarán las bibliotécas:
- dplyr
- nycflights13
En la cuarta sección abordaremos la estructura correcta de programación, en donde verás los veneficios de hacer un código escrito de forma correcta.
En la quinta sección entraremos ya con el análiis de datos, en este tema veremos como tratar a los datos para sacar información útil de los datos, en los cuales podemos sacar las variaciones, volores típicos, valores atípicos, valores inusuales, entre otros, estod datos los representaremos en histogramas, graficas de pastel, ojivas, etc. tambien se veran los casos en donde se presentan valores vacios o nulos, los cuales veremos como afectan a los demás datos.
para esta sección se utilizará la biblioteca:
- tidyverse
En la sexta sección