Дослідження та аналіз особливостей модифікації методу філогенетичного футпринтингу для відбору еволюційно-консервативних сайтів зв’язування транскрипційних факторів у еукаріот. Визначення та характеристика можливості пошуку у масштабі всього геному.
При низкой оригинальности работы "Розробка та застосування методів in silico для визначення сайтів зв’язування транскрипційних факторів у еукаріот на прикладі ISGF-3", Вы можете повысить уникальность этой работы до 80-100%
НАЦІОНАЛЬНА АКАДЕМІЯ НАУК УКРАЇНИ Автореферат дисертації на здобуття наукового ступеня кандидата біологічних наукРоботу виконано у лабораторії системної біології відділу механізмів трансляції генетичної інформації Інституту молекулярної біології і генетики НАН України. Офіційні опоненти: доктор біологічних наук, професор, член-кореспондент НАН України Кавсан Вадим Мусійович, Інститут молекулярної біології і генетики НАН України, завідувач відділу біосинтезу нуклеїнових кислот; Захист відбудеться 23 березня 2010 р. о 10:00 на засіданні спеціалізованої вченої ради Д 26.237.01 Інституту молекулярної біології і генетики НАН України за адресою: 03680, Київ, вул.Таким чином, пошук ISRE дозволить знайти ймовірні гени первинної відповіді на дію ІФН?. Актуальність теми зумовлена не лише великою кількістю доступних для аналізу повних геномів (683 геноми еукаріот у базі даних проекту DIARK) (Odronitz et al., 2007), але і бурхливим розвитком системної біології, яка потребує швидких та якісних методів аналізу великих обсягів геномної інформації з метою вивчення регуляторних схем, характерних досліджуваному геному. Мета дослідження - розробка універсального обчислювального методу пошуку СЗТФ і визначення за його допомогою генів первинної відповіді на ISGF-3, який активується внаслідок звязування ІФН? з рецептором, і забезпечує домінуючий інтерферон-специфічний шлях передачі сигналу від активованого рецептора. Методи дослідження: для пошуку СЗТФ використано власну реалізацію методу на основі позиційно-вагових матриць (ПВМ) та метод на основі прихованих моделей Маркова (ПММ) власної розробки; для відсіювання невірно-позитивних результатів застосовано власну модифікацію методу філогенетичного футпринтингу; аналіз на збагачення категорій Онтології Генів (ОГ) виконано за допомогою інструментів на основі гіпергеометричного тесту, точного тесту Фішера та Баєсового тесту. Вперше розроблено загальнодоступний онлайн-інструмент для пошуку СЗТФ у промоторах генів еукаріот у масштабі всього геному із використанням як методу на основі ПВМ, так і методу на основі ПММ.Для перевірки придатності існуючих методів на основі вагових матриць до пошуку СЗТФ у еукаріот “промоторну послідовність” було визначено, як нуклеотидну послідовність у межах 1000 нуклеотидів вище точки початку транскрипції. Пошук СЗТФ на обох ланцюгах ДНК із порогом подібності до матриці 80 % у послідовностях промоторів усіх генів R. norvegicus, що кодують білки, дозволив виявити 5214 СЗТФ у 4571 промоторі. У кінцевому переліку зі 768 генів 697 мали по одному ймовірному ISRE у промоторі, 59 генів мали два ймовірних ISRE, 10 генів мали три або більше ISRE у промоторі. Щоб оцінити ефект застосування філогенетичного футпринтингу, групу 768 генів порівняно із групою 4571 гена на збагачення категорій ОГ із використанням GO Tree Machine (Zhang et al., 2004); при цьому 20 категорій ОГ визначено, як достовірно збагачені. Для отриманої повної тривимірної матриці ми визначили функцію переходу tf, яка інтегрує водночас інформацію про сусідство та позиційно-ваговий компонент: (1) де: tf - функція переходу (транзитивна функція) між сусідніми нуклеотидами, i - позиція нуклеотиду, звідки відбувається перехід, i 1 - позиція нуклеотиду, у якому перехід закінчується, ni - нуклеотид у позиції i (один із ACGT), freq(ni , ni 1) - частота спільного знаходження двох нуклеотидів ni та ni 1 (взята із 4x4x(k-1) матриці сусідства), N - кількість послідовностей, із яких було обчислено необовязкову додаткову ПЧМ; N дорівнює Nseq, якщо користувач не надав додаткової ПЧМ, Nseq - кількість введених користувачем відомих послідовностей СЗТФ, - мінімальний компенсатор, fn,i - кількість виявлених нуклеотидів n у колонці i ПЧМ, fn,i 1 - кількість поточних виявлених нуклеотидів n у колонці i 1 ПЧМ.Розроблено новий метод пошуку сайтів звязування транскрипційних факторів та інструмент COTRASIF на його основі, за допомогою якого вперше виявлено 162 гени первинної відповіді на дію інтерферону альфа (ІФН?), з яких 61 ген є експериментально підтвердженими генами відповіді на дію ІФН? (за даними літератури), а для 101 гена таких підтверджень не виявлено. Показано, що пошук сайту звязування інтерферон-стимульованого фактора 3 (ISGF-3) у промоторах генів еукаріот за допомогою методу на основі позиційно-вагових матриць можливий, проте інтерпретація результатів ускладнена через низьку специфічність пошуку. Розроблено вдосконалений метод пошуку сайтів звязування транскрипційних факторів на основі прихованих моделей Маркова, що має вищу за метод на основі позиційно-вагових матриць специфічність пошуку сайтів звязування. В інструменті реалізовано два методи пошуку сайтів звязування (на основі позиційно-вагових матриць та прихованих моделей Маркова) та один метод відсіювання невірно-позитивних результатів (оригінальна модифікація методу філогенетичного футпринтингу).
План
Основний зміст
Вы можете ЗАГРУЗИТЬ и ПОВЫСИТЬ уникальность своей работы