Разработка программного обеспечения "Empirical-statistical comparison of texts" - Дипломная работа

бесплатно 0
4.5 112
Анализ существующего программного обеспечения эмпирико-статистического сравнения текстов: сounter оf сharacters, horos, graph, advanced grapher. Empirical-statistical comparison of texts: функциональность, процедуры и функции тестирование и внедрение.


Аннотация к работе
Развитая в данный момент методология математической статистики дает возможность осуществить новый подход к задаче датирования событий, описанных в исторических источниках [30]. В данной работе разработано программное обеспечение, которое опирается на принципиально новый эмпирико-статистический метод сравнения текстов, разработанный доктором физико-математических наук, профессором МГУ Анатолием Тимофеевичем Фоменко [9]. При разбиении текста на дискретные участки и подсчета количества символов, отведенных на каждый участок, можно получить так называемые профили этих текстов, по которым в дальнейшем необходимо построить графики профилей этих текстов. В общем виде, метод эмпирико-статистического сравнения текстов по принципу корреляции локальных максимумов, на котором основан метод сравнения текстов, формулируется следующим образом. Фрагменты X(t) мы будем условно называть "главами" [3]. а) Если две летописи (текста) X и Y заведомо зависимы, - то есть описывают один и тот же ряд событий исторического периода (A,B) одного и того же государства, - то графики объемов летописей X и Y должны одновременно достигать локальных максимумов на отрезке (А,В). б) Напротив, если летописи Х и Y заведомо независимы, то есть описывают либо разные исторические периоды (А,В) и (C,D), либо разные потоки событий в разных государствах, то графики объемов для летописей Х и Y достигают локальных максимумов в разных точках.Позволяет узнавать код любого символа, сколько раз он встречается в тексте, а так же найти все его позиции в тексте [17]. Программа позволяет решить только маленькую часть поставленных задач (например, подсчет количества символов участков текста) так как нет возможности построения графиков и нахождения локальных максимумов. Данное ПО первоначально использовалось заказчиком для работы с текстом, однако при работе был выявлен ряд недостатков: 1.Неудобный пользовательский интерфейс. 2.Сохранение результата не адаптировано под поставленную задачу, приходится сохранять профили в виде отдельных файлов.doc с таблицами и описанием профиля. В Advanced Grapher поддерживаются прямоугольная и полярная система координат, имеется возможность построения графика по таблице (создается внутри программы или вводится из файла) [7].Для достижения цели дипломной работы было разработано ПО «ESCT», которое позволяет представлять текстовые исторические источники в форме математических профилей, сохранять профили в файл, осуществлять построение графических отображений этих профилей с возможностью сохранения в графический файл, а также производить сравнительный анализ по эмпирико-статистическому методу сравнения текстов. Класс Chapter имеет следующие свойства: public string Name - имя главы, которое отображается в полях выбора опорных точек, а также на графике профиля. public int Position - позиция опорной точки, служащей конечной точкой главы. public int Count - количество символов текста, отведенное на данную главу. Класс служит для представления профиля текста и имеет следующие свойства: public string Name - имя профиля, которое отображается в списке профилей, на графике профиля, а также в отчете проведения анализа. public string PCOMMENT - комментарии, необходимые для того, чтобы пользователь мог отмечать, какие участки вызвали у него затруднение и на что следует обратить внимание, если результат анализа не будет однозначным. Файл Profiles.XML содержит в себе коллекцию объектов класса TEXTPROFILE, каждый из которых имеет следующую структуру: В парном теге содержится имя профиля, в комментарии к профилю, в содержатся все главы текста . Процедура создает профиль, помещает его в общую коллекцию, добавляет в списки всех профилей и сохраняет в файл Profiles.XML.Работа с текстом. 2.3 Удаление опорных точки. Каждая страница содержит необходимую информацию для работы с ПО «ESCT» и графические изображения элементов пользовательского интерфейса с указателем на тот элемент, который необходим для текущей операции. Также справочная система содержит встроенную поисковую систему, которая осуществляет поиск по ключевому слову и отображает все страницы, содержащие искомую информацию.Для тестирования ПО «ESCT» проведено: Сравнение результатов анализа текста при помощи ПО «ESCT» и результата анализа, проведенного А.Т.Фоменко. На основе полученных результатов можно установить, правильно ли выполняется алгоритм сравнения текстов методом эмпирико-статистического анализа текстов. Если в обоих случаях результат будет совпадать с результатом, полученным автором метода, значит ПО работает корректно и его можно вводить в опытную эксплуатацию. Рисунок 32 - график профиля текста ”Повесть временных лет”, полученный при помощи «ESCT» Результат анализа показал наличие следующих локальных максимумов: Таблица 3 - Сравнение локальных максимумов, полученных при помощи ПО «ESCT» со значениями локальных максимумов, полученными автором метода [15]В рамках дипломной работы были проанализированы существующие программные решения на предмет наличия возможности проведения

План
Содержание справочной системы:

Введение
2. Работа с текстом.

2.1 Загрузка текста.

2.2 Добавление опорных точек.

2.3 Удаление опорных точки.

3. Работа с профилями.

3.1 Сохранение графиков.

3.2 Сохранение профиля.

3.3 Проведения анализа.

4. Ошибки при работе с ПО.

Каждая страница содержит необходимую информацию для работы с ПО «ESCT» и графические изображения элементов пользовательского интерфейса с указателем на тот элемент, который необходим для текущей операции.

Рисунок 29 - Страница справочной системы «Добавление опорных точек»

Также справочная система содержит встроенную поисковую систему, которая осуществляет поиск по ключевому слову и отображает все страницы, содержащие искомую информацию.

Рисунок 30 - Встроенная поисковая система справочной системы
Заказать написание новой работы



Дисциплины научных работ



Хотите, перезвоним вам?