Комплексний метод побудови вирішуючих правил імовірнісних систем автоматичного розпізнавання, що навчаються - Автореферат

бесплатно 0
4.5 203
Стан досліджень в області систем автоматичного розпізнавання. Розробка комплексного методу побудови вирішуючих правил в імовірнісних САРЗ відкритого типа. Дослідження ефективності комплексного методу при побудові правил класифікації в імовірнісних САРЗ.

Скачать работу Скачать уникальную работу

Чтобы скачать работу, Вы должны пройти проверку:


Аннотация к работе
Одним з найбільш характерних прикладів даного твердження є застосування систем розпізнавання у компютерній лінгвістиці - напрямку теорії штучного інтелекту, що займається автоматичною обробкою природних мов та є базовою при створенні систем дистанційного навчання, побудові глобальних розподілених інформаційних структур і пошукових систем, систем тематичної класифікації текстів і реферування. Для вирішення задач автоматичної обробки природних мов застосовуються методи, засновані на морфологічному й латентно-семантичному аналізі для виділення ключових слів текстів, теорія математичної статистики для формування вектора частот ключових слів, теорія розпізнавання образів для реалізації завдань класифікації. Застосування відомих методів побудови вирішуючих правил класифікації для навчальних вибірок великого обсягу є малоефективним, тому розробка методів перетворення навчальних вибірок і побудови вирішуючих правил класифікації для САРЗ, що навчаються, із застосуванням технологій штучного інтелекту є актуальним науково-технічним завданням. Метою дисертаційної роботи є розробка методу побудови вирішуючих правил імовірнісних систем автоматичного розпізнавання відкритого типу, що навчаються, який дозволяє підвищити якість розпізнавання і знизити часові витрати на побудову вирішуючого правила і виконання класифікації. Запропонований новий метод побудови вирішуючих правил імовірнісних систем автоматичного розпізнавання відкритого типу, що навчаються, який комплексно включає спосіб визначення відособленості класів, метод формування зваженої навчальної вибірки мета-обєктів, генетичний алгоритм побудови вирішуючого правила, що дозволив підвищити якість розпізнавання, знизити часові витрати на побудову вирішуючих правил і виконання класифікації, скоротити обєм даних, що зберігаються.За наслідками аналізу розглянутих методів зроблений висновок про ефективність використання евристичних методів при побудові вирішуючих правил класифікації для підвищення ефективності розпізнавання і методів скорочення розміру навчальних вибірок, що мають значний обєм у багатьох сучасних САРЗ і необмежено зростають в системах відкритого типу, для зменшення обєму даних, що зберігаються, і часу виконання класифікації. У підрозділі 2.4 для скорочення розміру навчальної вибірки запропонований новий метод обєднання розташованих поруч в просторі ознак обєктів одного класу в мета-обєкти, що містять окрім значень ознак інформацію про кількість обєднаних в них обєктів початкової вибірки. Вибирається обєкт f (початкова точка формування мета-обєкту) одного з класів k1, для якого сума відстаней до всіх обєктів найбільш близько розташованого класу k2 максимальна IMG_00592720-10b6-4845-933c-ec5c46b8938d обєктів початкової навчальної вибірки; два мета-обєкти не можуть містити один і той же обєкт початкової вибірки; мета-обєкт відноситься до того ж класу, що і всі обєкти, в нього включені. Особливістю запропонованого методу є виявлення можливості включення обєктів, що додаються, у вже наявні мета-обєкти (якщо відстань в просторі ознак від обєкту, що додається, до найближчого мета-обєкту цього ж класу менша за відстань до найближчого мета-обєкту іншого класу) або необхідності побудови нового мета-обєкту.У дисертаційній роботі запропоновано нове рішення актуальної задачі розробки ефективних методів побудови вирішуючих правил імовірнісних систем автоматичного розпізнавання відкритого типу, що навчаються. В результаті аналізу сучасного стану завдання побудови систем автоматичного розпізнавання, методів побудови вирішуючих правил у системах розпізнавання, що навчаються, і методів скорочення навчальних вибірок було показано, що існуючі методи не дозволяють будувати ефективні за якістю і часом розпізнавання системи для прикладних завдань, що характеризуються значним обємом початкових даних, і можливістю їх поповнення в процесі роботи. На підставі аналізу можливих варіантів розташування обєктів навчальної вибірки у просторі ознак був запропонований спосіб визначення відособленості класів шляхом побудови кардинальної гіперплощини, що дозволяє одержувати вирішуюче правило для відособлених класів мінімальної довжини. Вперше був запропонований і обґрунтований метод скорочення початкової навчальної вибірки шляхом побудови вибірки мета-обєктів для двокласових і багатокласових систем розпізнавання, що дозволяє по безлічі розташованих поруч обєктів деякого класу будувати мета-обєкти, що описуються окрім значень ознак розпізнавання масою. Запропонований новий метод побудови вирішуючих правил імовірнісних систем автоматичного розпізнавання, що навчаються, який комплексно включає спосіб визначення відособленості класів, метод формування зваженої навчальної вибірки мета-обєктів, генетичний алгоритм побудови вирішуючого правила, що дозволив підвищити якість розпізнавання, знизити часові витрати на побудову вирішуючого правила і виконання класифікації, скоротити обєм даних, що зберігаються.

План
ОСНОВНИЙ ЗМІСТ РОБОТИ

Вывод
У дисертаційній роботі запропоновано нове рішення актуальної задачі розробки ефективних методів побудови вирішуючих правил імовірнісних систем автоматичного розпізнавання відкритого типу, що навчаються. Запропоноване рішення полягає в застосуванні комплексного підходу, що включає як обробку вхідних даних, так і побудову вирішуючих правил з використанням генетичних алгоритмів. Отримані результати мають важливе наукове і прикладне значення для створення ефективних систем автоматичного розпізнавання, що навчаються, особливо систем відкритого типу. Проведені дослідження дозволили отримати наступні результати.

1. В результаті аналізу сучасного стану завдання побудови систем автоматичного розпізнавання, методів побудови вирішуючих правил у системах розпізнавання, що навчаються, і методів скорочення навчальних вибірок було показано, що існуючі методи не дозволяють будувати ефективні за якістю і часом розпізнавання системи для прикладних завдань, що характеризуються значним обємом початкових даних, і можливістю їх поповнення в процесі роботи.

2. На підставі аналізу можливих варіантів розташування обєктів навчальної вибірки у просторі ознак був запропонований спосіб визначення відособленості класів шляхом побудови кардинальної гіперплощини, що дозволяє одержувати вирішуюче правило для відособлених класів мінімальної довжини.

3. Вперше був запропонований і обґрунтований метод скорочення початкової навчальної вибірки шляхом побудови вибірки мета-обєктів для двокласових і багатокласових систем розпізнавання, що дозволяє по безлічі розташованих поруч обєктів деякого класу будувати мета-обєкти, що описуються окрім значень ознак розпізнавання масою. Виконаний аналіз способів визначення початкової і конкуруючої точок побудови мета-обєктів, оцінена достовірність розробленого методу по статистичних характеристиках початкової і одержаної навчальних вибірок. Для систем розпізнавання відкритого типа запропонований новий метод додавання нових обєктів в навчальну мета-вибірку, запропонований новий метод коректного додавання даних у вибірку мета-обєктів, що є необхідною умовою створення систем розпізнавання відкритого типу, що навчаються.

4. Одержав подальший розвиток метод потенційних функцій шляхом розповсюдження його на зважені навчальні мета-вибірки, що дозволило використовувати при побудові вирішуючих правил не тільки значення ознак розпізнаваних обєктів, але знання про розташування обєктів навчальної вибірки у просторі ознак.

5. Розроблений генетичний алгоритм побудови вирішуючого правила по мета-вибірці, у якому вперше правило представлене у вигляді псевдобулевої функції, запропонований спосіб імовірнісного формування початкової популяції хромосом, що враховує вагу обєктів навчальної вибірки, запропонований метод обчислення подвійної фітнес-функції, визначений і обґрунтований набір генетичних операторів, серед яких виділяються знижуюча та підвищуюча мутації, і оператор циклічного зрушення.

5. Запропонований новий метод побудови вирішуючих правил імовірнісних систем автоматичного розпізнавання, що навчаються, який комплексно включає спосіб визначення відособленості класів, метод формування зваженої навчальної вибірки мета-обєктів, генетичний алгоритм побудови вирішуючого правила, що дозволив підвищити якість розпізнавання, знизити часові витрати на побудову вирішуючого правила і виконання класифікації, скоротити обєм даних, що зберігаються.

6. У експериментах на тестових даних запропонований комплексний метод показав збільшення здатності розпізнавання одержуваними вирішуючими правилами, у порівнянні з вирішуючими правилами, побудованими класичними методами, в середньому на 11% і скорочення часу класифікації розпізнаваних обєктів на 36%. У експериментах на відомих тестових прикладах комплексний метод дозволив побудувати вирішуючі правила, що забезпечують в середньому 96,88% правильних класифікацій, що на 3,5% більше результатів, одержуваних найбільш ефективними на сьогодні методами побудови вирішуючих правил класифікації, зокрема, методами на основі генетичних алгоритмів.

7. Застосування розробленого комплексного методу для вирішення завдання побудови спам-фільтрів при фільтрації вхідної електронної кореспонденції дозволило підвищити точність класифікації листівок у середньому на 37%.

8. Результати, одержані в дисертаційній роботі, використані у науково-дослідних роботах відділу розпізнавання мовних образів Донецького інституту проблем штучного інтелекту МОН і НАН України, у розробках ТОВ «Бі-Тек», а також в учбовому процесі кафедри програмного забезпечення інтелектуальних систем Державного університету інформатики і штучного інтелекту.

Список литературы
1. Е.В. Волченко Модифицированный метод потенциальных функций // Бионика интеллекта - 2006. - №1(64). - с. 86-92.

2. Е.В.Волченко Генетический алгоритм биссекции графов // Искусственный интеллект. - 2007. - №1. - с. 233-237.

3. Е.В.Волченко Анализ эффективности выбора условий формирования обучающей выборки мета-объектов. // Вестник Хмельницкого национального университета. - 2007. - №2, Том 1. Технические науки. - с. 85-89.

4. Е.В.Волченко Метод формирования обучающей выборки мета-объектов для многоклассовых систем распознавания // Искусственный интеллект. - 2007. - №4. - с. 284-290.

5. Е.В.Волченко Генетический алгоритм построения потенциальной функции // Зб. наук. пр. ДОННТУ. Серія: Обчислювальна техніка та автоматизація, випуск 12 (118). - Донецьк: ДОННТУ. - 2007. - с. 133-142.

6. Е.В.Волченко Анализ эффективности выбора условий формирования обучающей выборки мета-объектов // Реферативний збірник наукових праць за результатами міжнародної науково-практичної конференції „Компютерні системи в автоматизації виробничих процесів”. - Хмельницький, 2007. - с. 21.

7. Е.В.Волченко Генетический анализ биссекции графов // Тезисы докладов Международной научной конференции «Компьютерные науки и информационные технологии». - Саратов, 2007. - с. 22-24.

8. Е.В.Волченко Метод формирования обучающей выборки мета-объектов для многоклассовых систем распознавания // Искусственный интеллект. Интеллектуальные системы: Материалы восьмой международной научно-технической конференции. - Донецк-Таганрог-Минск, 2007. - с. 225-227.

9. Е.В.Волченко Метод построения решающего правила вероятностной обучающейся системы распознавания средствами генетических алгоритмов // Материалы второй международной научной конференции «Современные информационные системы. Проблемы и тенденции развития». - Харьков-Туапсе, 2007. - с. 467-468.

10. Е.В.Волченко Многошаговое построение решающих правил обучающихся систем распознавания // Материали першої міжнародної науково-технічної конференції «Інтелектуальні системи в промисловості та освіті - 2007». - Суми, 2007. - с. 16-18.

Вы можете ЗАГРУЗИТЬ и ПОВЫСИТЬ уникальность
своей работы


Новые загруженные работы

Дисциплины научных работ





Хотите, перезвоним вам?