Skip to content

Segunda parte de un estudio estadístico a partir de las 50 mejores caciones de la plataforma Spotify.

License

Notifications You must be signed in to change notification settings

ArielXL/spotify-stage-two

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Informe escrito

Autores

Nombre(s) y Apellidos Correo GitHub
Carlos Aryam Martínez Molina c.molina@estudiantes.matcom.uh.cu @carlosmartinezmolina
Eziel Ramos Piñón e.ramos@estudiantes.matcom.uh.cu @ezielramos
Ariel Plasencia Díaz a.plasencia@estudiantes.matcom.uh.cu @ArielXL

Resumen

El objetivo de este trabajo es, a partir de un conjunto de datos que coincide con las 50 mejores canciones de la aplicación Spotify, realizar un estudio estadístico aplicando las técnicas de regresión lineal simple y múltiple, análisis de varianza y de reducción de dimensiones para llegar a conclusiones precisas sobre características y propiedades de las canciones antes mencionadas.

En nuestro conjunto de datos predominan los datos cuantitativos, por lo que nos dimos la libertad de insertar algunas variables cualitativas con el fin de tener mayores argumentos a la hora de comparar nuestras canciones. Entre las observaciones agregadas y usadas principalmente a partir del capítulo 5 tenemos la Colaboración que representa la existencia o no de múltiples cantantes, el Año de Nacimiento, el Género Musical constituido por los valores pop, reggaeton y otros y el Tamaño de la canción que denota si el tema es corto o largo en dependencia de si la duración es menor al promedio de los segundos de todas las canciones. Para llevar a cabo lo explicado anteriormente nos apoyaremos en el lenguaje de programación R, el cual fue diseñado por Ross Ihaka y Robert Gentleman en 1933 y es muy utilizado en nuestros días para la investigación por la comunidad estadística, en el campo de la minería de datos, la investigación biomédica, la bioinformática y las matemáticas financieras. Para todo este análisis tomaremos un nivel de significación de 0.05 y es necesario mencionar que nos apoyamos en librerías que nos provee el lenguaje R, entre las que se encuentran lmtest, ggplot2, car, factoextra, cluster, purrr, gridExtra, lsr y psych utilizadas fundamentalmente para el análisis de los supuestos, para plotear los gráficos y la confección de clústeres.

Para una explicación y análisis más detallada de nuestros objetivos propuestos consulte nuestro Informe Escrito.

About

Segunda parte de un estudio estadístico a partir de las 50 mejores caciones de la plataforma Spotify.

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published