Aquest sistema recomanador està dissenyat per explorar i avaluar diferents enfocaments per recomanar pel·lícules als usuaris en funció de les seves interaccions prèvies i les característiques de les pel·lícules. Les dades provenen d'un conjunt reduït de qualificacions (ratings_small.csv) i metadades de pel·lícules (movies_metadata.csv)
- Descarregar el la BD del següent link: https://www.kaggle.com/datasets/rounakbanik/the-movies-dataset?select=movies_metadata.csv
- Executar l'arxiu cleaner.py de la carpeta Data_Acces
- Dins de la carpeta recomanadors està l'arxiu funcio_principal.py des d'on es poden executar tots els recomanadors
- Si ja has inicialitzat les dades, pots entrar a cada recomanador de manera separada, cadascún té un main per fer recomanacions y probes amb el propi recomanador
- Tots els arxius tenen una funció per printejar les dades de manera clara, a part del id de la DB
- Leer base de datos
- Poner base de datos en formato database (pandas)
- Visualizar datos (peliculas mas votadas, con rating global más alto, etc...)
- Limpiar database <- No prioritario
- Implementació del models col·laboratius item-item i user-based
- Implementació del model basat en contingut
- Neteja de la base de dades
- Surt a compte netejar la base de dades? Millora el rendiment dels recomanadors?
- Efectivament, la netja de la base de dades, tot i que encara simple, pot reduïr en gran quantitat el temps d'execució dels models
- Quin model de recomendació és millor pels usuaris que han puntuat més pel·lícules? I pels que han puntuat menys?
- Algún model afavoreix a que s'escolleixin pel·lícules amb més puntuacions? I amb menys?
- Implementar SVD
- Comprovar que els models funcionan correctament
- Graficar les dades
- Es pot millorar l'accuracy dels recomanadors?
- Existeixen realment clusters diferenciats pels que separar la BD?
- Una implemnetació creuada entre models podria millorar les recomanacions o provoca overfitting?