Розробка методів розпізнавання вторинної структури білків на основі байєсівської процедури розпізнавання на нестаціонарних ланцюгах Маркова. Дослідження особливостей запису генетичної інформації в послідовностях ДНК людини та геномах вищих організмів.
Аннотация к работе
Інститут кібернетики імені В.М. Автореферат дисертації на здобуття наукового ступеня кандидата фізико-математичних наук Робота виконана в Інституті кібернетики імені В.М. Науковий керівник: доктор фізико-математичних наук, професор, Гупал Анатолій Михайлович, Інститут кібернетики ім. Офіційні опоненти: доктор фізико-математичних наук, професор, Іванов Олександр Володимирович, Київський національний університет «КПІ», доктор фізико-математичних наук, старший науковий співробітникВ дисертації будемо дотримуватись цього принципу: на основі байєсівського підходу будуть побудовані ефективні процедури розпізнавання для таких структур обєктів, як ланцюги Маркова і незалежні ознаки. Актуальність теми полягає в тому, щоб розробити ефективні (оптимальні) процедури мінімізації середнього ризику (2) для таких структур обєктів, як ланцюги Маркова і незалежні ознаки, та отримати верхні та нижні оцінки похибок процедур від вхідних параметрів задачі. Побудова оцінок в дискретному випадку є нетривіальною задачею, оскільки заздалегідь невідомо, як кількість станів обєктів, кількість ознак і кількість значень ознак будуть представлені в оцінках процедур розпізнавання. В дисертації вирішуються наступні задачі: отримати нижню оцінку складності класу задач розпізнавання у дискретному випадку в залежності від розмірів класів навчаючої вибірки, кількості ознак та числа значень ознак; розробити методи розпізнавання вторинної структури білків на основі байєсівської процедури розпізнавання на нестаціонарних ланцюгах Маркова;У дисертаційній роботі проведено детальний аналіз методів мінімізації емпіричного ризику і байєсівських процедур розпізнавання, а також побудованих похибок для цих методів. Виведено детерміновані нижні і верхні оцінки похибки байєсівської процедури розпізнавання у дискретному випадку для незалежних ознак. На основі критерію ч2 розвязано серію задач розпізнавання гіпотез відносно стаціонарності або нестаціонарності ланцюгів Маркова, а також визначення порядку ланцюга Маркова. Отримано нижню оцінку складності класу задач розпізнавання у дискретному випадку в залежності від розмірів класів навчаючої вибірки, кількості ознак та числа значень ознак. Розроблено алгоритми розпізнавання вторинної структури білків на основі байєсівської процедури розпізнавання на нестаціонарних ланцюгах Маркова.