Сегментація і нормалізація зображень. Основні функціональні можливості та режими роботи комплексу розпізнавання письмового тексту. Розробка комплексу оптичного розпізнавання символів. Шрифтові та безшрифтові алгоритми розпізнавання друкованого тексту.
Аннотация к работе
На стадії підготовки і обробки інформації, особливо при компютеризації підприємства, виникає завдання введення великого обєму текстової і графічної інформації в ПК. Завдання розпізнавання текстової інформації при переведенні друкованого і рукописного тексту в машинні коди є одним з найважливіших завдань, що мають на меті автоматизацію документообігу. Що ж стосується систем розпізнавання друкованих документів, то тут складність полягає в тому, що у відповідальних завданнях, таких як, наприклад, автоматизація введення паспортно-візової інформації, необхідно забезпечити високу надійність розпізнавання (більше 98-99%) навіть при поганій якості друку. Отримане одержувати зображення аналізується, фіксуються його наступні параметри: особливі точки, структура контура, ланцюговий код. Для вирішення завдань розпізнавання символів і текстів останнім часом широко використовуються нейронні мережі, де надійність розпізнавання багато в чому залежить від вибору структури і параметрів мережі.Проблема носить явно виражений комплексний ієрархічний характер і включає низку основних етапів: сприйняття поля зору, сегментація, нормалізація виділених обєктів, розпізнавання. Основним елементом будь-якого завдання розпізнавання зображень є відповідь на питання: чи відносяться вхідні зображення до класу зображень, який представляє даний еталон? Здавалося б, відповідь можна отримати, порівнюючи безпосередньо зображення з еталонами (або їх ознаки). · Зображення еталону і вхідні зображення відрізняються положенням в полі зору. Багаторічний досвід роботи в області обробки зображень дозволяє запропонувати класифікацію основних методів обробки і розпізнавання системами технічного зору відповідно до схеми, приведеної на рис.Кожен друкований текст має первинну властивість - шрифти, якими він надрукований.Шрифтові або шрифтозалежні алгоритми використовують апріорну інформацію про шрифт, яким надруковано букви. Недоліки зазначеного підходу: v алгоритм повинен заздалегідь знати шрифт, що йому представляють для розпізнавання, тобто він повинен зберігати в базі різні характеристики цього шрифту; v якість розпізнавання тексту, надрукованого довільним шрифтом, буде прямо пропорційна кореляції характеристик цього шрифту зі шрифтами, наявними в базі програми. Очевидно, що цей блок буде вносити свою частку помилок в інтегральну оцінку якості розпізнавання, або функцію встановлення шрифту доведеться покласти на користувача. Програма, заснована на шрифтовому алгоритмі розпізнавання символів, вимагає від користувача спеціальних знань про шрифти взагалі, про їхні групи й відмінності один від одного, про шрифти, якими надруковано документ користувача.Другий клас алгоритмів - безшрифтові або шрифтонезалежні, тобто алгоритми, що не мають апріорних знань про символи, що надходять до них на вхід. Ці алгоритми вимірюють й аналізують різні характеристики (ознаки), що властиві буквам як таким безвідносно шрифту й абсолютного розміру, яким вони надруковані. У граничному випадку для шрифтонезалежного алгоритму процес навчання може бути відсутнім. Фактично це означає, що різні допуски й спрощення при вимірах характеристик символів для роботи безшрифтових алгоритмів можуть бути в 2-20 разів більші в порівнянні зі шрифтовими. Це означає, з одного боку, можливість застосування цього підходу у випадках великої різноманітності символів, які можуть надійти на вхід системи; з іншого боку, за рахунок закладеної в них здатності узагальнювати, такі алгоритми можуть екстраполювати накопичені знання за межі навчальної вибірки, тобто стійко розпізнавати символи, на вигляд далекі від тих, які були присутні в навчальній вибірці. v технологічність.При розпізнаванні друкованих і рукодрукованих (написаних від руки незлитих образів, схожих з великими друкарськими буквами) символів можуть використовуватися добре вивчені структурні методи, які передбачають розбиття образу на окремі складові частини. Перший метод який ми розглянемо використовує для розпізнавання топологічний опис зображень, які можна вважати плоскими графами. Відповідний опис отримують обходом в певному порядку контурів зображення з одночасною фіксацією індексів точок. Розпізнавання рукодрукованих символів подієвим методом містить ряд недоліків, таких як відсутність оцінок, неможливість розпізнавання образів, що складаються з декількох компонент звязності, і сильне огрублення представлення, яке часто втрачає особливі точки, кривизну образу і ін. Отримання скелетного представлення символу - це не кінець, це зображення використовується потім для виділення характеристик символу.Розрізняють два види технології розпізнавання рукопису: традиційний напрямок читання паперових документів, що називають «автономним» (off-line), і більш пізніший - «оперативний» (online), у якому як інструмент використовуються перо і спеціальний екран, сприйнятливі до руху пера і фіксуючі його траєкторію. Задача розпізнавання рукописного тексту найбільш складна з цих трьох, і існуючі на сьогодні технології в цій області можуть застосовуватись тільки
План
Зміст
Вступ
Розділ 1. Теоретичні основи розпізнавання зображень
1.1 Сегментація, нормалізація і розпізнавання зображень
1.2 Алгоритми розпізнавання друкованого тексту
1.2.1 Шрифтові алгоритми розпізнавання друкованого тексту
1.2.2 Безшрифтові алгоритми розпізнавання друкованого тексту
1.3 Алгоритми розпізнавання рукодрукованих символів
1.4 Розпізнавання рукописних символів
1.5 Використання нейронних мереж як один із методів розпізнавання тексту
1.6 Огляд і характеристика існуючих комплексів розпізнавання письмового тексту
Розділ 2. Розробка комплексу оптичного розпізнавання символів
2.1 Постановка задачі та формування вимог до створення комплексу
2.2 Опис проекту та алгоритмів реалізації комплексу розпізнавання тексту
2.3 Засоби і середовище створення комплексу
2.4 Основні функціональні можливості та режими роботи комплексу розпізнавання письмового тексту
2.5 Організація тестування та налагодження комплексу розпізнавання письмового тексту
2.6 Рекомендації по впровадженню і використанню комплексу розпізнавання письмового тексту