Идея проекта состоит в том, чтобы реализовать метрики новизны и разнообразия, и сделать полное сравнение ранее реализованных подходов (коллаборативная фильтрация, матричная факторизация, нейросетевые методы) по всем метрикам (RMSE, NDCG, MAP, diversity, novelty). Также рассмотреть уже готовые реализации алгоритмов рек. систем в существующих библиотеках.
Задание:
- Скачать набор данных о рейтингах кинофильмов по ссылке https://grouplens.org/datasets/movielens/ (файл ml-latest-small.zip).
- Разделить данные на тренировочный и тестовый наборы данных с учетом времени в соотношении 70/30.
- Реализовать метрики новизны и разнообразия.
- Установить библиотеки Surprise и Cornac.
- Сравнить реализации матричной факторизации из библиотеки Surprise со своим реализованным подходом по метрикам рек. систем (включая новизну и разнообразие).
- Взять любой нейросетевой метод из библиотеки Cornac и сравнить со всем ранее реализованными подходами по метрикам рек. систем (включая новизну и разнообразие).
- Заполнить таблицу по всем результатам лабораторных работ.
Выполненный проект находится в папке src.