Разработка клиент-серверной системы для создания рекомендационных материалов в виде новостных статей. Сущность коллаборативной фильтрации по различным критериям. Модель Байеса. Кластерная модель программы. Факторизация матриц. Проблемы подходов.
Аннотация к работе
Данная работа посвящена изучению проблемы персонализации информации, изучению существующих подходов для создания рекомендательных систем, анализу и сравнению алгоритмов персонализации, а также реализации клиент-серверной программы для создания персонализированной ленты новостей (подписки) . В первой части работы будет проведен анализ существующих решений и подходов персонализации - коллаборативной фильтрации на основе модели и соседстве, метод факторизации матриц и гибридные решения.Данная программа подразумевает реализацию клиентской части, через которую пользователь будет просматривать новости и получать готовые рекомендации, и серверной части, которая обрабатывает информацию, приходящую с клиентской части, сохраняет статистику пользователей, выполняет рекомендационные алгоритмы и формирует результат в виде рекомендаций новых новостей. В такой ситуации напрашивающимся решением является создание специальной системы, которая будет показывать те новости, которые могут заинтересовать пользователя. Работа всех видов данного метода основывается на утверждении о том, что пользователи, одинаково оценившие предметы системы, имеют склонность одинаково оценить и другие предметы системы. Также одним из допущений является тот факт, что пользователи дают оценку предмету системы по выборочной шкале, например, оценивая фильм от одной до десяти звезд на сайте imdb.com (рис. Для работы этого алгоритмов необходимо создать модель Байеса для каждого пользователя, который оценивал какие-либо объекты, на основе содержания этих объектов (Для фильмов это могут быть актеры или жанры, для новостей - ключевые слова и категории).В ходе данной работы была реализована программа для персонализации новостной подписки, представляющая собой клиент-серверную систему.