Обработка страниц социальных сетей и блогосферы (парсинг) для генерации таблицы упоминаний. Поиск соответствия паттерна экстрактора комбинации CSS-классов и HTMLтегов. Настройки экспорта данных и атрибутов поля "Автор комментария" в модуле Feeds.
Аннотация к работе
СИСТЕМА АВТОМАТИЗИРОВАННОГО ПОСТРОЕНИЯ ГРАФА СОЦИАЛЬНОЙ СЕТИВ Северо-Кавказском научном центре высшей школы Южного федерального университета (далее СКНЦ ВШ ЮФУ) разработана программная платформа автоматизированного построения графа социальной сети при помощи обработки интернет страниц социальных сетей. Для генерации таблицы упоминаний обработка страниц социальных сетей и блогосферы (парсинг) реализуется с применением модуля Feeds для CMF Drupal с плагином SIMPLEHTMLDOMPARSER. В процессе парсинга система обращается к странице с информацией в Интернет и производит выборку данных из DOM дерева HTML в соответствии с набором тегов и каскадной таблицей стилей. В результате в системе будет сформирована таблица с набором данных о комментариях, представленная на рис. 4: заголовок комментария, дата его импорта в систему, автор комментария, автор блога, к которому относится комментарий, текст комментария, дата его публикации в сети Интернет, тональность (позитив, негатив, нейтрал), определяемая пользователем системы.