Підвищення рівня автоматизації систем підготовки та редагування технічної документації. Аналіз процесу автоматизованого виготовлення нормованої технічної документації за допомогою програмного забезпечення. Структура та реалізація інформаційної бази.
Аннотация к работе
Існуючі на сьогоднішній день розробки в цій області (системи AUTHORIT, SODA та ін.), реалізують змістовну обробку текстів технічних документів лише частково і не забезпечують можливостей автоматизованої побудови похідних текстових фрагментів. Реалізація таких можливостей, на основі нечітких відношень та правил доказових перетворень, дозволить підвищити рівень автоматизації систем підготовки та редагування ТД (СПРТД), розширити область їх ефективного застосування, а також зробити їх більш гнучкими з точки зору більш повного використання потенційних можливостей. Дисертаційна робота виконувалась у розвиток робіт за державною науково-технічною програмою "Сучасні інформаційні технології в створенні інтегрованих виробничих комплексів" за темою "Розробка, дослідження та застосування засобів інтелектуалізації в процесі проектування баз даних та прикладних програм в автоматизованих системах на базі ПЕОМ" (№ держреєстрації 0195u008180, 1994-96 рр.), в рамках робіт напрямку "Перспективні інформаційні технології, прилади, системи звязку", що виконувались кафедрою обчислювальної техніки НТУУ "КПІ" в продовж 1997-99 рр, НДР № 0102U000333 "Побудова масштабованих ізоефективних компютерних систем", яка виконувалась на кафедрі обчислювальної техніки НТУУ "КПІ" в продовж 2002-2004 рр., та НДР № 0201U006269 "Побудова високопродуктивних паралельних обчислювальних систем з архітектурою на основі розподіленої загальної памяті", яка виконувалась на кафедрі обчислювальної техніки НТУУ "КПІ" в продовж 2002-2006 рр. Метою дисертаційної роботи є підвищення продуктивності та рівня автоматизації СПРТД за рахунок розширення змістовних операції обробки текстів з елементами верифікації, що реалізуються за допомогою програмних засобів логічного доведення та нечітких відношень. У роботах, опублікованих у співавторстві, здобувачу належить: [2] - запропоновано метод структурованого формування та редагування нормованої технічної документації, [3] - запропоновано семантичні характеристики для оцінки технічної документації, [4] - запропонована методика адаптації формалізмів інженерії знань стосовно задач обробки технічних текстів, [5] - запропоновано структуру спеціалізованої інформаційної бази, а також правила їх аналізу і перетворення у фреймові структури, [6] - запропоновано методи оцінки структурно-параметричних семантичних характеристик в ієрархічних моделях текстових матеріалів, [11, 12, 13] - удосконалено метод організації шаблонів та методика удосконалення семантичної релевантності, [14, 15,] - запропоновано алгоритми формування технічного документу використовуючи при цьому модель проблемної області, [17, 18] - запропоновано підхід до підвищення рівня автоматизації аналітичних систем обробки технічних текстів.Крім цього показано, що існуючи системи не реалізують повною мірою потенційні можливості семантичної обробки з використанням сучасних досягнень інженерії знань. Тому розвиток таких систем в напрямку використання методів інженерії знань, а також їх інтеграції з методами та алгоритмами семантичної обробки дає можливість підвищити ефективність використання СПРТД. Для представлення (формалізації) проблемної області доцільно використовувати механізми інженерії знань, обробка яких являє собою обробку їх змісту правилами перетворення тих форм, якими вони описуються в машині. За допомогою правил формування Rfi = zi (EJOFJI) надається можливість сінтеза похідних текстових фрагментів Dder= ?i (Rfi (Dti), Qei, Qvi), використовуючи правила, які в найпростішому випадку представляють собою булеві функції Rbi = xi (EIOSI), а в більш складних випадках використовуються правила Rki = fi (EIOSI) для обробки та корегування в форматі найближчого відомого зразка. Для взаємодії в рамках системи база знань Gi має відповідну структуру: Gi = (RIIN, Rla, Rsyn, Rsec, Ld, BKL, Bka), (5) де RIIN - правила вводу інформації, Rla - правила логічних доведень, Rsyn - правила синхронізації БЗ, Rsec - правила гарантування безпеки доступу до БЗ системи, Ld - опис природних мов які обробляються системою, BKL - мовонезалежна БЗ, Bka - аналітична частина БЗ.Для розвязання цієї задачи виявилося необхідним розробити моделі представлення знань й методики побудови шаблонів та сценаріїв, які використовуються з метою ефективного інтегрованого середовища накопичення знань. Запропоноване рішення скорочує час розробки комплектів ТД за рахунок автоматизації семантичних операцій; сприяє скороченню програмного коду та вихідного ПЗ за рахунок вилучення близьких по змісту шаблонів документів на основі використання принципу схожості моделей на всіх рівнях ієрархії, а також зменшує обчислювальну складність за рахунок введення комбінаторних обмежень. Основні наукові й практичні результати роботи полягають у наступному: На основі аналізу існуючих СПРТД розроблено й формалізована модель інформаційної структури для відтворення бази знань довільної проблемної області з гнучким нижнім рівнем відтворення атомарних пон