Удосконалення методики оцінки ефективності інформаційного пошуку. Побудова моделі поширення інформації у мережі Інтернет. Вдосконалення трирівневої системи для знаходження текстових документів. Створення метапошукової програми та інтерфейсу користувача.
Аннотация к работе
Національна академія наук УкраїниРоботу виконано в Дніпропетровському національному університеті, Міністерство освіти і науки України. Науковий керівник: - кандидат технічних наук, доцент, СНІЖКО Євген Матвійович, доцент кафедри експериментальної фізики Офіційні опоненти: - доктор технічних наук, професор, ГРИША Сергій Миколайович, професор Національного технічного університету України “КПІ” кандидат технічних наук, ІГНАТЕНКО Петро Петрович, завідувач відділу Інституту програмних систем НАН України. Захист відбудеться “10” січня 2002 р. о 14 годині на засіданні спеціалізованої вченої ради Д 26.165.01 по захисту дисертації на здобуття наукового ступеня (доктора) кандидата наук у Національній бібліотеці України імені В. І.Існуючі інформаційно-пошукові системи (ІПС) Інтернет не завжди дозволяють знайти в мережі інформацію, що потрібна користувачеві. Робота виконувалася відповідно до плану науково-дослідних робіт Дніпропетровського національного університету за темами №075-5-18-01 "Моделі та технології розробки інтелектуальних програмних систем"; №075-8-11-99 "Розробка інтерфейсів для автоматизації наукових досліджень", а також відповідно до держбюджетної науково-дослідної теми №07-118-99 "Механізми сполучення електрогенезу і форми клітин нервової системи, що розвиваються" (№ держреєстрації 0199U001305). Для досягнення поставленої мети в роботі сформульовані і вирішені такі задачі дослідження: побудова моделі інформаційного пошуку і поширення інформації в мережі Інтернет; виявлення причин недостатньої ефективності більшості існуючих ІПС; удосконалення моделі представлення текстових документів; розробка структури ІПС для ефективного пошуку в мережі Інтернет; розробка способів поліпшення якості функціонування ІПС у глобальній мережі; розробка ефективного інтерфейсу користувача ІПС; визначення характеристик і побудова методики для порівняння ефективності функціонування ІПС глобальної мережі. Наукова новизна одержаних результатів полягає в тому, що: Розроблено трирівневу структуру системи інформаційного пошуку в мережі Інтернет, першим рівнем якої є ІПС глобальної мережі, другим - мультиагентна пошукова система і третім - автоматизована система управління документами. Розроблено метод побудови інтерфейсу користувача для відображення результатів пошуку, який полягає в групуванні отриманих документів так, щоб вектори відхилень цих документів від пошукового запиту були розташовані в одних сегментах векторного простору.Обґрунтована необхідність: побудови адекватних моделей поширення і пошуку інформації у мережі Інтернет; виявлення недостатньо ефективних етапів пошукового процесу й розробки методів і технологій їх формалізації й автоматизації; виявлення чинників, що негативно впливають на результати пошуку; розробки методів для ослаблення впливу цих чинників; удосконалення моделей і методів відображення інформації в ІПС; розробки ефективної системи інформаційного пошуку в мережі, визначення її структури, побудови її складових частин, організації ефективного інтерфейсу користувача; розробки методики оцінки якості інформаційного пошуку в Інтернет. Розроблено трирівневу структуру системи інформаційного пошуку в мережі Інтернет для забезпечення єдиного доступу до багатьох розподілених джерел інформації, зокрема електронних бібліотек. Перший рівень - це ІПС глобальної мережі, які збирають відомості про документи в мережі і забезпечують доступ до більшої частини Інтернет через 103-104 входів для пошуку, а також пошукові засоби електронних бібліотек. Її основні задачі: динамічний розподіл пошукового процесу по різним ІПС; взаємодія із системами першого рівня: формалізація запиту на інформаційно-пошукових мовах, звертання до ІПС і отримання списків адрес; перевірка актуальності гіперзвязків Інтернет і отримання документів; оцінка релевантності і ранжирування разом із системою третього рівня. Розроблено удосконалення векторної моделі представлення текстових документів, що полягає у виконанні додаткового нормування на одиницю міри близькості двох документів (документа і запиту) у векторній моделі.Здійснений подальший розвиток векторної моделі, який полягає у введенні додаткового нормування на одиницю міри близькості, що дає можливість більш точно оцінювати релевантність незалежно від довжини текстового документу та кількості термінів у пошуковому запиті, як в бінарному, так і у зваженому уявленні. Проблема автоматизації процесу пошуку розділяється на три групи задач, для рішення яких розроблена трирівнева структура системи інформаційного пошуку в мережі Інтернет, першим рівнем якої є ІПС глобальної мережі, другим - мультиагентна пошукова система і третім - автоматизована система управління документами. Така структура дозволяє використати існуючі ІПС мережі, автоматизувати побудову пошукових запитів на основі масивів релевантних документів користувача, забезпечити єдиний доступ до багатьох розподілених джерел інформації, зокрема, електронних бібліотек.