Trabajos finales para la materia de Inferencia Estadística 2022 de la carrera de Licenciatura en Ciencia de Datos.
Realice estos trabajos durante mi cursada en el año 2022 y fueron mi primer experiencia en el ambito del machine learning con Python. La verdad me resultó muy interesante y desafiante el hecho de tener que entender el dataset con el cual estoy trabajando y poder demostrar teorias con realizando graficos. Por otra parte, el entrenar el modelo usando varios metodos y algoritmos me demostro como hay muchas maneras de resolver el mismo problema, siendo en algunos casos, unas mejores que otras.
El proyecto se divide en dos partes:
Este fue el primer trabajo, donde tuve que buscar que dataset utilizar. Al encontrar el que me intereso, comence a investigarlo y tratar de entender todo lo que podia antes de comenzar a programar. En esta carpta se encuentra el archivo .ipynb donde se encuentra el codigo crudo mas los graficos. Luego se encuentra el informe en formato PDF donde desarrollo explayadamente los procedimientos que seguí y los resultados a los que llegué. En este trabajo utilize los siguientes algoritmos:
- PCA
- Naive Bayes (Gaussian y Bernoulli)
- Discriminante Lineal y Cuadratico
- Regresion Logistica
Para este trabajo utilice el mismo dataset, pero en este caso hice uso de otro tipo de algoritmos:
- PCA
- KMeans
- Clustering Aglomerativo
- DBSCAN