Изучение подхода к автоматизированному пополнению онтологической базы знаний "О Мире" при помощи синтактико-семантического анализа путем "начитывания" естественно-языковых текстов для качественного повышения уровня автоматизированного разрешения анафоры.
Аннотация к работе
Прагматический анализ с применением подходов к автоматизированному созданию онтологической базы знанийПодход особенно применим для языков, широко использующих выразительные средства, в частности - русского, нежели чем для языков, опирающихся на строгие морфологические и синтаксические правила. В предлагаемой работе рассматриваются подходы к автоматизированному разрешению межклаузной референции в дискурсах текстов при помощи онтологической базы знаний «О Мире» (далее - БЗ), а также подходы к автоматизированному извлечению знаний из массивов текстов (корпусов) (text data mining) и пополнению БЗ. Интенсивное развитие систем ЕЯ-анализа, как один из вариантов, представляется возможным при тесном взаимодействии с системами онтологического распознавания образов (изображений) и распознавания речи. анафора семантический текст автоматизированный Полученная информация может лечь в основу БЗ и сыграть немаловажную роль в референциальном (прагматическом) анализе ЕЯ-текстов. Достоинством описываемой интеграции систем ЕЯ-анализа и распознавания является репрезентативность получаемых данных (анализируются реальные изображения, объекты, события, речь и явления) и автоматизация процесса пополнения БЗ.
Список литературы
1. [Aqualife, 2006] Журнал о природе и путешествиях Aqualife - http://dudu.narod.ru/hydro.htm
2. [Bateman, 2006] Bateman J. Natural Language Generation Systems. - http://www.fb10.uni-bremen.de/anglistik/langpro/NLG-table/nlg-table-date-sort.html
7. [Азарова и др., 2002] Азарова И.В., Митрофанова О.А., Синопальникова А.А., Ушакова А.А., Яворская М.В. Разработка компьютерного тезауруса русского языка типа WORDNET // Доклады научной конференции «Корпусная лингвистика и лингвистические базы данных» СПБ., 2002.
8. [Баранов, 1996] Баранов О.С. Идеографический словарь русского языка -М.: ЭТС 1996.
10. [Каневский, 2000] Каневский Е.А. Атрибуты существительных // Информационные технологии в гуманитарных и общественных науках: семантико-синтаксический анализ текстов. - СПБ.: СПБ ЭМИ РАН, 2000. Вып. 9.
11. [Каневский и др., 2000] Каневский Е.А., Клименко Е.Н., Тузов В.А. Об одном подходе к классификации прилагательных // Труды Международного семинара Диалог"2000 по компьютерной лингвистике и ее приложениям. - М.: РОСНИИ Искусственного Интеллекта, 2000. Т. 2.
12. [Клещев и др., 2001] Клещев С.А., Артемьева И.Л. Математические модели онтологий предметных областей. Часть 1. Существующие подходы к определению понятия «онтология» // Научно-техническая информация, серия 2 «Информационные системы и процессы», 2001. №2.
13. [Ножов, 2003] Ножов И.М. Морфологическая и синтаксическая обработка текста (модели и программы) // Диссертация на соискание ученой степени кандидата технических наук. - М. 2003.
14. [Сокирко, 2001] Сокирко А.В. Семантические словари в автоматической обработке текста (по материалам системы ДИАЛИНГ) // Диссертация на соискание ученой степени кандидата технических наук. - М. 2001.
15. [Сокирко, 2005] Сокирко А.В. Первичный семантический анализ - http://www.aot.ru/docs/seman.html
16. [Толпегин, 2006] Толпегин П.В., Ветров Д.П., Кропотов Д.А. Алгоритм автоматизированного разрешения анафоры местоимений третьего лица на основе методов машинного обучения // Компьютерная лингвистика и интеллектуальные технологии: Труды международной конференции «Диалог 2006» (Бекасово, 31 мая - 4 июня 2006 г.) / Под ред. Н.И. Лауфер, А.С. Нариньяни, В.П. Селегея. - М.: Изд-во РГГУ, 2006.