Исследование основных концепций информационного поиска: булева и векторная модели, меры подобия и определение веса индексных терминов. Оценка неранжированных наборов результата поиска. Реализация векторной модели в среде Matlab, листинг программы.
Аннотация к работе
1. Исследование основных концепций информационного поиска 2. Исследование моделей поиска информации 2.1 Булева модель 2.2 Векторная модель 2.3 Меры подобия 2.4 Определение веса индексных терминов 3. Реализация векторной модели в среде Matlab 4.1 Функция расчета евклидовой меры 4.2 Функция расчета косинусной меры 4.3 Расчет ранжированных списков документов 5. Реализация оценок качества поиска в среде Matlab 5.1 Расчет точности, полноты и F-меры в зависимости от числа найденных документов 5.2 Листинг программы 6. Основной целью системы ИП является получение информации, которая может быть полезна и релевантна для пользователя, с использованием его запроса. Каждый документ связан с вектором индексных терминов: wi,j=g(dj), где g - это функция, которая вычисляет вес термина ti в документе dj (wi,j=0 обозначает термин ti, который не появляется в dj) и M - это количество индексных терминов.