Анализ разработки архитектуры интеллектуальной информационной системы. Создание правил для получения дополнительных данных с помощью методологии UML. Осуществление инфологического моделирования базы данных. Особенность проектирования базы знаний.
Аннотация к работе
Федеральное государственное бюджетное образовательное учреждение высшего образования «Поволжский государственный университет телекоммуникаций и информатики»Social network analysis) представляет собой исследование социальных сетей, рассматривающее социальные отношения в терминах теории сетей. С этим связан феномен социализации персональных данных: стали публично доступными биографии, переписка, дневники, фото, видео, аудиоматериалы, заметки о путешествиях и т.д. Это открывает беспрецедентные возможности для решения исследовательских и бизнес-задач (многие из которых до этого невозможно было решать эффективно изза не достатка данных), а также создания вспомогательных сервисов и приложений для пользователей социальных сетей. Актуальность бакалаврской работы состоит в постоянной необходимости поиска и уточнения целевой аудитории и увеличения релевантности рекламных сообщений. Для достижения поставленной цели необходимо решить следующие основные задачи: · Дать содержательное описание объекта исследования;Социальные сети представляют собой платформу, обеспечивающую построение и организацию социальных взаимоотношений. Социальные сети, созданные как инструмент общения и обмена информацией между пользователями, ежедневно генерируют огромный поток информации. Все социальные сети характеризуются своей целевой аудиторией, спецификой взаимодействия, принципами организации сообществ и связей между пользователями. Ведь термин социальная сеть появился благодаря социологам в начале XX века и означала комплект сложных отношений между личностями. Системы смогут реализовывать обычный наблюдение социальных сетей, анализ социальных сетей, моделирование действий в социальных сетях, руководство социальными сетями.Он характеризует сетевые структуры с точки зрения узлов (отдельных актеров, людей или предметов внутри сети) и связей или границ (связей или взаимодействий), которые их соединяют. Эти сети часто визуализируются через социограммы, в которых узлы представлены в виде точек, а связи представлены линиями. В начале 20 века социологи использовали концепцию «социальных сетей» для обозначения сложных наборов отношений между членами социальных систем во всех масштабах: от межличностного до международного. В 1954 году Джон Арундел Барнс начал использовать этот термин систематически, чтобы обозначать шаблоны связей, охватывая концепции, традиционно используемые общественностью, и те, которые используются социологами: ограниченные группы (например, племена, семьи) и социальные категории (например, пол, этническая принадлежность) , Ученые, такие как Рональд Берт, Кэтлин Карли, Марк Грановеттер, Дэвид Кракхардт, Эдвард Лауманн, Анатолий Рапопорт, Барри Уэлман, Дуглас Р. Анализ социальных сетей ценен, например, для контроля потока информации, улучшения связи, повышения устойчивости сети, поиска сообщества или доверия сообщества.Structural Clustering Algorithm for Networks (SCAN). Данный алгоритм определяет ядра в графе, то есть такие вершины, у которых достаточно много смежных вершин (определяется параметром m), имеющих с ядром много общих соседей (определяется параметром e). В этой модели рассматривается матрица F размера , элемент которой имеет смысл силы принадлежности (affiliation strength) i-ой вершины к j-ому сообществу. Устанавливается связь между матрицей F и самим графом, после чего методом максимизации правдоподобия для заданного графа подбирается оптимальная матрица F. Для выбора алгоритма были проведены несколько тестов: 1) Тест на модульность - демонстрирует плотность связей между вершинами внутри кластера и разреженность связей между самими кластерами.Аналогично, всемирная сеть может быть смоделирована как граф, где веб-страницы представлены как вершины, соединенные ребром, когда одна страница содержит гиперссылку на другую. Эти методы имеют тенденцию группировать сети таким образом, что в каждом кластере существует плотное множество ребер и несколько ребер между кластерами. Некоторые вершины являются членами кластеров; Некоторые вершины являются концентраторами, которые соединяют многие кластеры, но не принадлежат ни одному из них, а некоторые вершины являются выбросами, которые имеют только слабые ассоциации с определенным кластером. Существующие методы, такие как основанный на модульности алгоритм, разбивают этот пример на два кластера: один состоит из вершин от 0 до 6, а другой состоит из вершин с 7 по 13. Они не изолируют вершину 6, концентратор, членство в котором либо кластер является спорным, или вершина 13, которая имеет только одно соединение с сетью.Написание моделей на UML преследует одну элементарную цель - облегчение процесса передачи информации о системе. За любым символом UML стоит строго конкретная семантика, что позволяет избегать погрешностей интерпретации (ответы на вопросы вида «а что имел в виду разработчик Х, когда он описал иерархию классов Y…» и т.п. будут достаточно прозрачны).
План
Содержание
Введение
1. Аналитическая часть
1.1 Содержательное описание объекта исследования
1.2 Перспективы применения ИИС анализа пользователей соцсети
1.3 Обзор алгоритмов кластеризации
1.4 Описание алгоритма SCAN
1.5 Выбор средств проектирования и разработки ИИС
2. Проектная часть
2.1 Разработка архитектуры ИИС
2.2 Функциональное моделирование
2.3 Инфологическое проектирование
2.4 Проектирование базы знаний
3. Экспериментальная часть
3.1 Алгоритм работы прототипа интеллектуальной информационной системы