Біологічний прототип і штучний нейрон. Найпростіші нейронні мережі. Дослідження нервової системи. Вибір структури нейронної мережі. Класифікація нейронних мереж. Задачі для вирішення нейронних мереж. Функції, які не реалізуються одношаровою мережею.
Аннотация к работе
Перше систематичне вивчення штучних нейронних мереж було зроблено Маккалокком і Піттсом в 1943 році. Основні завдання, які ставляться перед нейронними мережами, відносяться до завдань розпізнавання образів. Потім на вхід мережі подається деякий невідомий образ, і мережа намагається за певним алгоритмом співвіднести його з будь-яким еталонним образом.Нейрон має такі основні властивості: 1. Нейрон взаємодіє шляхом обміну електрохімічними сигналами двох видів: електротонічними (зі загасанням) і нервовими імпульсами (спайками), що поширюються без загасання, стихання. Вони відрізняються картиною дендритів, наявністю і довжиною аксона і розподілом синапсів біля клітини. Біологічний нейрон містить такі структурні одиниці: Тіло клітини (1) - сома: містить ядро (2), мітохондрії (забезпечують клітину енергією), інші органели, що підтримують життєдіяльність клітини. Синапс (5) - місце контакту нервових волокон - передає збудження від клітини до клітини.В останні десятиліття в світі бурхливо розвивається нова прикладна область математики, що спеціалізується на штучних нейронних мережах (НМ). За допомогою НМ можна, наприклад, передбачати показники біржового ринку, виконувати розпізнавання оптичних або звукових сигналів, створювати саморозвинені системи, здатні керувати автомашиною при парковці або синтезувати мову по тексту. Далі під нейроном буде матися на увазі штучний нейрон, тобто комірка НМ. Кожен нейрон характеризується своїм поточним станом за аналогією з нервовими клітинами головного мозку, які можуть бути порушені або загальмовані. Він володіє групою синапсів - односпрямованих вхідних звязків, зєднаних з виходами інших нейронів, а також має аксон - вихідний звязок даного нейрона, з якого сигнал (збудження або гальмування) надходить до синапсу наступних нейронів.Як приклад найпростішої НМ розглянемо трьохнейронний перцептрон (рис.1.4), тобто таку мережу, нейрони якої мають активаційну функцію у вигляді одиничного стрибка.Для вирішення деяких окремих типів завдань вже існують оптимальні, на сьогоднішній день, конфігурації, описані, наприклад, в [2], [3], [4] та інших виданнях. Якщо ж завдання не може бути зведене до жодного з відомих типів, розробнику доводиться вирішувати складну проблему синтезу нової конфігурації. При цьому він керується кількома основними принципами: можливості мережі зростають зі збільшенням числа осередків мережі, щільності звязків між ними і числом виділених шарів; введення зворотних звязків поряд зі збільшенням можливостей мережі піднімає питання про динамічну стійкість мережі; складність алгоритмів функціонування мережі (в тому числі, наприклад, введення декількох типів синапсів - збудливих, припиняючих та ін.) також сприяє посиленню НМ. Очевидно, що процес функціонування НМ, тобто сутність процесів, які вона здатна виконувати, залежить від величин синаптичних звязків, тому, задавшись певною структурою НМ, що відповідає будь-якій задачі, розробник мережі повинен знайти оптимальні значення всіх змінних вагових коефіцієнтів (деякі синаптичні звязки можуть бути постійними). Цей етап називається навчанням НМ, і від того, наскільки якісно він буде виконаний, залежить здатність мережі вирішувати поставлені перед нею проблеми під час експлуатації.Перші з них оперують з двійковими сигналами, і вихід кожного нейрона може приймати тільки два значення: логічний нуль ("загальмований" стан) і логічна одиниця ("збуджений" стан). До цього класу мереж відноситься і розглянутий вище перцептрон, так як виходи його нейронів, що формуються функцією одиничного стрибка, рівні або 0, або 1. В аналогових мережах вихідні значення нейронів здатні приймати безперервні значення, що могло б мати місце після заміни активаційної функції нейронів перцептрону на сигмоид. На рисунку 1.5 представлений двошаровий перцептрон, отриманий з перцептрону з рисунка 1.4 шляхом додавання другого шару, що складається з двох нейронів. Тут доречно відзначити важливу роль нелінійності активаційної функції, так як, якщо б вона не володіла даними властивістю або не входила в алгоритм роботи кожного нейрона, результат функціонування будь-якої р-шарової НМ з ваговими матрицями W (i), i = 1,2,. ..p для кожного шару i зводився б до перемножування вхідного вектора сигналів X на матрицюРобота всіх мереж зводиться до класифікації (узагальнення) вхідних сигналів, що належать n-мірному гіперпростору, по деякому числу класів. Число таких класів для однієї НМ перцептроном типу не перевищує 2m, де m - число виходів мережі. Наприклад, одношаровий перцептрон, що складається з одного нейрона з двома входами, представлений на рисунку 1.4, не здатний розділити площину (двовимірне гіперпространоство) на дві півплощини так, щоб здійснити класифікацію вхідних сигналів по класах A Якщо придивитися до таблиці 1.1, можна помітити, що дане розбиття на класи реалізує логічну функцію виключає АБО для вхідних сигналів. Рішення задач, які підпадають під це обмеження, полягає в застосуванні 2-х і більше шарових мереж або мереж з нелінійними синап