Разработка аналитической информационной системы - Курсовая работа

бесплатно 0
4.5 91
Ранжирование информации. Сравнение методов и моделей прогнозирования для анализа поисковых запросов. Сбор данных о количестве упоминаний в новостях. Проектирование схемы баз данных. Разработка экранных форм. Тестирование и отладка информационной системы.


Аннотация к работе
Сегодня в сети Интернет размещаются колоссальные объемы информации. Определенная ее часть предоставляется в открытом доступе любому пользователю сети Интернет. На основании необходимости быстрого поиска релевантной информации выросла отдельная отрасль в сфере информационных технологий, а именно сфера предоставления поисковых услуг в сети Интернет для пользователей. Один из лидеров данной отрасли в мировом масштабе - компания Google обрабатывает порядка 41 млрд. 345 млн. пользовательских запросов в месяц [15]. А в случае удачного прогнозирования изменения величины конкретного поискового запроса можно определять будущие потребности пользователей сети Интернет.Одной из первых, кто отметил практическую значимость исследования пользовательских поисковых запросов, была Аманда Спинк в своей статье "Searching the Web: The public and their queries" в 2001 году [10]. Исследовать статистику пользовательских поисковых запросов на протяжении нескольких лет могли позволить себе только компании - поисковые сервисы, либо их компании - партнеры. Пользовательский поисковый запрос - слово, словосочетание или предложение, вводимое человеком в поисковую Web - систему с целью получения релевантной информации. Под поисковыми Web - системами здесь понимаются так называемые «Search Engines», сервисы, предоставляющие пользователям сети Интернет получать искомую информацию [15]. В более широком смысле, поисковые системы постоянно «сканируют» и индексируют Web - «пространство», определяют значимость того или иного ресурса, его полезность и соответствие тому или иному пользовательскому поисковому запросу.Можно выделить общую черту для любого решения в электронной коммерции, в продажах посредством сети Интернет - необходимость в заданное время предоставить целевой аудитории готовое и ожидаемое предложение. При соответствии определенным ключевым словам и фразам, с точки зрения поисковой системы, тот или иной информационный ресурс может оказаться в первых строчках результирующего набора пользователей по определенному запросу, а как следствие - поток новых пользователей. Такой источник еще называют «естественным» [7] по причине того, что человек перешел на web - ресурс не по кому-либо рекламному объявлению, а изза соответствия ресурса и искомому запросу. Ранжирование поисковой выдачи подразумевает автоматическое исследование просканированной информации на предмет соответствия определенному ключевому запросу пользователя в определенном регионе и в определенное время. Однако следует заметить, что информацию о названных выше алгоритмах можно найти в открытых источниках, и в случае, если бы ранжирование основывалось только на указанных алгоритмах - задача предоставления поисковым системам достаточно проработанной информации с целью улучшения релевантности своих информационных ресурсов в поисковых системах согласно конкретным поисковым запросам была бы практически решена.Исходя из того, что любое решение, или прогноз - это проекция явления в будущее, а будущее - содержит элемент неопределенности, то важно при выборе методов и моделей прогнозирования адекватно оценивать в какой степени та или иная модель или метод соответствует реальной ситуации, и какого качества можно получить результат. Авторы в англоязычных и в отечественных работах, как правило, не задаются вопросом классификации моделей и методов для прогнозирования, а просто их перечисляют и описывают. Но для общего понимания, какие методы или модели необходимо применять в задаче прогнозирования пользовательских поисковых запросов не обходимо провести классификацию и методов и моделей для определения ключевых особенностей того или иного метода, для определения преимуществ и недостатков и специфики решаемых задач. В свою очередь, формализованные методы - описанные в литературе методы прогноза, по результатам которых создают модели прогнозирования, другими словами выделяют математическую зависимость, с помощью которой в дальнейшем производят прогнозирование с заданными параметрами. Исходя из того, что непосредственно сам способ разработки прогноза во многом определяется целью, для которой предназначен прогноз, это и является главным критерием - другими словами ответ на вопрос: «для чего разрабатывается прогноз?».В рамках данной работы над пользовательскими поисковыми запросами, при загрузке статистики необходимо контролировать корректность данных, соответственно исследуемому пользовательскому запросу, дате, локации количества запросов. Трансформация данных в аналитическом приложении непосредственно перед выполнением анализ, когда его цели и методы ясны, позволяет аналитику наилучшим образом подготовить данные, выделить и подчеркнуть в них необходимую информации для наиболее эффективного ее использования.

План
Оглавление

Введение ......................................................................................................................2

Глава 1. Анализ предметной области .......................................................................4

1.1. Анализ ключевых понятий ..............................................................................4

1.2. Ранжирование информации.............................................................................9

1.3. Основы прогнозирования...............................................................................12

1.3.1. Виды и формы прогнозирования..............................................................12 1.3.2. Сущность прогнозирования поисковых запросов...................................15 1.3.3. Сравнение методов и моделей прогнозирования для анализа поисковых запросов...............................................................................................................15 1.4. Описание бизнес-процессов ..........................................................................18 1.5. Анализ основных характеристик существующих решений.......................21 Глава 2. Разработка информационной системы.....................................................23 2.1. Сбор статистики..............................................................................................25 2.1.1. Сбор данных о количестве поисковых запросов.....................................25 2.1.2. Сбор данных о количестве упоминаний в новостях...............................26 2.2. Реализация методов прогнозирования..........................................................26 2.3. Проектирование схемы баз данных ..............................................................27 2.4. Разработка экранных форм............................................................................30 2.5. Тестирование и отладка информационной системы...................................31 Заключение................................................................................................................33 Библиографический список.....................................................................................34 Приложение А. Техническое задание.....................................................................36 Приложение Б. Листинг основных функций..........................................................48 Приложение В. Тесты...............................................................................................55 Приложение Г. Примеры исходных статистических данных ..............................57 Приложение Д. Сравнение методов и моделей прогнозирования.......................58

1
Заказать написание новой работы



Дисциплины научных работ



Хотите, перезвоним вам?