Разработка средств повышения релевантности информационно-поисковых систем на базе онтологий - Автореферат

бесплатно 0
4.5 173
Анализ технологий построения моделей систем извлечения информации из глобальной сети. Информационно-поисковая система, основанная на онтологиях, для извлечения и семантического представления структурированной информации из неструктурированного текста.


Аннотация к работе
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук Разработка средств повышения релевантности информационно-поисковых систем на базе онтологийРабота выполнена на кафедре «Вычислительная техника и информационные системы» Федерального государственного бюджетного образовательного учреждения высшего профессионального образования «Воронежская государственная лесотехническая академия» (ФГБОУ ВПО ВГЛТА). Научный руководитель доктор технических наук, профессор Зольников Владимир Константинович, ФГБОУ ВПО «Воронежская государственная лесотехническая академия», заведующий кафедрой «Вычислительная техника и информационные системы» А.А.Угарова (филиал) федерального государственного образовательного учреждения высшего профессионального образования «Национальный исследовательский технологический университет «МИСИС» (СТИ НИТУ «МИСИС»), заведующий кафедрой «Автоматизированные и информационные системы управления». Абрамов Геннадий Владимирович доктор технических наук, профессор ФГБОУ ВПО «Воронежский государственный университет инженерных технологий», заведующий кафедрой «Информационные технологии моделирования и управления»Описываются следующие методики/модели: методика формирования правил извлечения информации, полностью независимых от предметной области; модель извлечения информации из неструктурированного текста; алгоритмы извлечения предметно-независимой информации. Здесь, ri шифрует правило, что если существует специфическая последовательность меток зависимостей, без учета порядка (определенная множеством D), вместе с некоторой цепью в графе зависимостей данного предложения, тогда последовательность ребер (которые представляют слова в соответствующем предложении) формирует информационную составляющую, и, таким образом, алгоритму поручается их извлечение. Таким образом, нужно извлечь следующие составляющие для данного случая: pred1 = {Вершина с двумя ребрами с метками “nsubj” и “ccomp”} sub1 = {Вершина1 - вершина, которая связана с вершиной pred1 ребром с меткой “nsubj”, и вершина, связанная с Вершина1 ребром с меткой “nn” или “quantmod”}. В общей сложности, нужно извлечь следующие составляющие для данного случая: pred1 = {Вершина с двумя ребрами с метками “nsubj” и “dobj”} sub1 = {Вершина1-вершина, которая связана с вершиной pred1 ребром с меткой “nsubj”, и вершина, связанная с Вершина1 ребром с меткой “nn” или “quantmod”} obj1 = {Вершина1 - вершина, которая связана с вершиной pred1 ребром с меткой “dobj”, и вершина, связанная с Вершина1 ребром с меткой “nn” или “quantmod”} qual1 = {Вершина с двумя ребрами с метками “prep” и “amod”} val1 = {Вершина, которая связана с qual1 ребром с меткой “amod”} Формальное определение вышесказанного следующее: Правило проверки: Для текстового фрагмента Z, состоящего из предложений {Ti}, со множеством слов {Wi}, набор TCTR потенциальных составляющих, извлеченных при помощи алгоритма извлечения, описания предметной области, охваченной в онтологии O(R,C), множества экземпляров Y, функции h : Y > P(C) и отображением F из множества W к , который может классифицировать слова в предложении экземпляру в Y или связи в R (покуда такое отображение интуитивно, на основах области дискурса), процесс проверки (валидации) в результате должен привести к множеству {K={si, pi, oi}} 3-кортежей si, pi, oi (проверенных составляющих), при условии, что имеет место следующее: Модуль обогащения: В случае с определениями (квалификаторами) создаются новые определения в модели онтологии, чтобы вычислить подходящие связи.
Заказать написание новой работы



Дисциплины научных работ



Хотите, перезвоним вам?