Создание электронного филологического словаря. Использование не реляционной базы данных. Средства JavaScript для создания интерактивности на странице. Серверный язык программирования PHP. Специфика словарной статьи. Взаимодействие с базой данных.
Для обозначения Всемирной паутины также используют слово веб (англ. web "паутина") и аббревиатуру WWW. Всемирную паутину образуют сотни миллионов веб-серверов. Джентльменский набор Web-разработчика ("Д. н. w. р", читается "Денвер") - проект Дмитрия Котерова, локальный сервер (Apache, PHP, MYSQL, Perl и т.д.) и программная оболочка, используемые Web-разработчиками для разработки сайтов на "домашней" (локальной) Windows-машине без необходимости выхода в Интернет. Эмулятор sendmail и SMTP-сервера (отладочная "заглушка" на localhost: 25, складывающая приходящие письма в /tmp в формате. eml); поддерживается работа совместно с PHP, Perl, Parser и т.д. Однако даже для такой мелочи, как SSI (Server-side Includes - директивы в страницах, позволяющие вставлять на нужное место содержимое других файлов), уже необходим сервер. Как видно на рисунке, структура статьи состоит из заглавного слова (MYARTICLE), которое может содержать окончания (ending, типа String), лингвокультурологический комментарии (lingv_com, объект класса Word), картинка (picture, типа String), а также объект Word, описанный ниже.В результате разработки программного обеспечения удалось настроить не реляционную базу MONGODB, подключится к ней через браузер для чтения и добавления новых данных. При разработке формы вводы удалось ознакомиться с языком программирования JAVASCRIPT, с помощью которого и был осуществлен весь интерактивный функционал ввода данных.
План
Содержание
Введение
Инструментальные средства курсового проекта
Денвер - локальный сервер для разработки веб приложения
Архитектура Денвера
Необходимость локального сервера Денвер
MONGODB. База данных с NOSQL архитектурой
PHP. Серверный язык программирования
JAVASCRIPT, как инструмент интерактивности
Ajax
JQUERY
Структурные составляющие программы
Специфика словарной статьи
Взаимодействие с базой данных
Заключение
Библиографический список
Введение
Создание онлайн служб и сервисов заполняют веб пространство, упрощая жизнь, ускоряя процесс циркуляции информации. С появлением ноутбуков, нетбуков, планшетов, коммуникаторов, смартфонов, возможности пользоваться онлайн сервисами и услугами существенно возрастают.
Всемирная паутина (англ. World Wide Web) - распределенная система, предоставляющая доступ к связанным между собой документам, расположенным на различных компьютерах, подключенных к Интернету. Для обозначения Всемирной паутины также используют слово веб (англ. web "паутина") и аббревиатуру WWW. Всемирную паутину образуют сотни миллионов веб-серверов. Большинство ресурсов всемирной паутины основаны на технологии гипертекста. Гипертекстовые документы, размещаемые во Всемирной паутине, называются веб-страницами. Несколько веб-страниц, объединенных общей темой, дизайном, а также связанных между собой ссылками и обычно находящихся на одном и том же веб-сервере, называются вебсайтом. Для загрузки и просмотра веб-страниц используются специальные программы - браузеры.
Всемирная паутина вызвала настоящую революцию в информационных технологиях и взрыв в развитии Интернета. Часто, говоря об Интернете, имеют в виду именно Всемирную паутину, однако важно понимать, что это не одно и то же.
Целью курсовой работы является использование всемирной паутина для создания электронного филологического словаря.
Задачами курсовой работы являются: научиться использовать не реляционную базу данных;
изучение JAVASCRIPT для создания интерактивности на странице;
изучение Php, настройка и использование;
настройка и взаимодействие веб приложения с базой данных MONGODB.
Инструментальные средства курсового проекта
Денвер - локальный сервер для разработки веб приложения
Джентльменский набор Web-разработчика ("Д. н. w. р", читается "Денвер") - проект Дмитрия Котерова, локальный сервер (Apache, PHP, MYSQL, Perl и т.д.) и программная оболочка, используемые Web-разработчиками для разработки сайтов на "домашней" (локальной) Windows-машине без необходимости выхода в Интернет. Главная особенность Денвера - удобство при удаленной работе сразу над несколькими независимыми проектами и возможность размещения на Flash-накопителе.
Базовый (основной) пакет Денвера включает в себя: · Инсталлятор (поддерживается также инсталляция на flash-накопитель).
· Apache, SSL, SSI, mod_rewrite, mod_php.
· PHP5 с поддержкой GD, MYSQL, SQLITE.
· MYSQL5 с поддержкой транзакций.
Система управления виртуальными хостами, основанная на шаблонах. Чтобы создать новый хост, вам нужно лишь добавить директорию в каталог /home, править конфигурационные файлы не требуется. По умолчанию уже поддерживаются схемы именования директорий многих популярных хостеров; новые можно без труда добавить.
Система управления запуском и завершением всех компонентов Денвера.
PHPMYADMIN - система управления MYSQL через Web-интерфейс.
Эмулятор sendmail и SMTP-сервера (отладочная "заглушка" на localhost: 25, складывающая приходящие письма в /tmp в формате. eml); поддерживается работа совместно с PHP, Perl, Parser и т.д.
В Денвере также имеется возможность установить следующие пакеты расширений: · полная версия ACTIVEPERL 5.8;
· PHP5 с полным набором модулей;
· язык программирования Python;
· СУБД POSTGRESQL или INTERBASE/FIREBIRD версий 1 и 2;
· старый-добрый PHP версии 3 или 4;
· или даже Parser студии Лебедева.
Все это вы можете скачать и установить, причем "грязную работу" возьмет на себя инсталлятор, входящий в пакет.
Архитектура Денвера
Отличительной особенностью Денвера является его полная автономность. Она заключается в следующем.
Денвер устанавливается в один-единственный каталог и вне его ничего не изменяет. Он не пишет файлы в Windows-директорию и не "гадит" в Реестре. При желании вы можете даже поставить себе сразу два Денвера, и они не будут конфликтовать.
Никакие "сервисы" NT/2000 не "прописываются". Если вы запустили Денвер, то он работает. Если завершили - то перестает работать, не оставляя после себя следов.
Системе не нужен деинсталлятор - достаточно просто удалить каталог.
Установив Денвер однажды, вы можете затем просто переписывать его на другие машины (на произвольный диск в произвольную директорию). Это не приведет ни к каким побочным эффектам.
Все конфигурирование и настройка под конкретную машину происходит автоматически.
Эти же правила распространяются и на пакеты расширений.
В целях упрощения работы компонентов комплекса и улучшения совместимости с реальным Unix-хостером при старте создается специальный виртуальный диск, присоединенный к основной директории.
Виртуальный диск - это просто синоним для некоторой папки на реальном, или физическом, диске. Подключается он при помощи команды subst, о чем заботятся скрипты Денвера. Вы можете работать с виртуальным диском, как с обычным. При этом все операции в действительности будут производиться с указанной директорией. Механизм работы виртуальных дисков встроен в ОС и не ведет к каким-либо издержкам и замедлениям.
За счет применения виртуального диска Денвер "изнутри" похож на маленький Unix: у него есть своя директория /home, /usr, /tmp. Различные компоненты и серверы расположены так, как это принято в Unix. Например, в /home располагаются виртуальные хосты, а в /usr - программные компоненты.
Такая архитектура в действительности не имеет ничего общего с системой Cygwin (хотя и похожа). Тем не менее, некоторые пакеты расширений Денвера могут использовать Cygwin для своих внутренних целей, но это всегда "прозрачно" для пользователя.
Вопреки распространенному мнению, Денвер не является чем-то статическим и неизменным. Никто не мешает вам устанавливать поверх него дополнительные программы и компоненты (например, сервер СУБД POSTGRESQL). Они просто будут для него "как родные". Вы можете также задавать логику запуска и завершения дополнительных сервисов по аналогии с тем, как это сделано в базовом пакете. Так что, если вам нужна какая-то система, которой нет в пакетах расширений, смело ставьте и конфигурируйте ее вручную.
Необходимость локального сервера Денвер
В последнее десятилетие во всем мире наблюдается настоящий бум среди Web-разработчиков (по преимуществу это программисты). Они устанавливают у себя на Windows-машине сервер Apache с различными дополнениями к нему: PHP, Perl, MYSQL и т.д. - преимущественно в целях более удобной отладки сайтов.
Многие (преимущественно дизайнеры) могут спросить: зачем вообще нужен локальный Web-сервер, когда страницы можно открывать и так - прямо с диска? Если это обычные (статические) HTML-страницы, то да, сервер не нужен. Однако даже для такой мелочи, как SSI (Server-side Includes - директивы в страницах, позволяющие вставлять на нужное место содержимое других файлов), уже необходим сервер. Не говоря уж о скриптах - они без сервера просто не запустятся.
Обычно все эти проблемы решают при помощи FTP-клиентов: закачивают исправленные страницы и скрипты на "настоящий" сервер в Интернете, смотрят, что получилось, затем лезут в редактор, исправляют, снова закачивают и т.д. до бесконечности. Главный недостаток такого подхода очевиден: необходимо все время быть подключенным к Интернету. Также очень желательно иметь хорошую связь, потому что в противном случае работа будет продвигаться крайне медленно.
Мне относительно регулярно приходят письма со следующим - обычно завуалированным - вопросом: чем отличается "просмотр страниц, открывая файл в браузере" от "просмотра с использованием сервера". В первом случае вы выбираете в меню что-то вроде Файл - Открыть - Обзор и выбираете нужный файл на диске. Браузер показывает его без всякой обработки, и путь в его адресной строке выглядит примерно вот так (Рис. 1.3.1):
Рис. 1.3.1 Отображение адреса
Если же вы открываете страницу "через сервер", происходит совершенно иное. Вообще, вы должны привыкнуть к мысли, что ваш "локальный" сервер ничем не хуже любого другого, расположенного в Интернете. А значит, он тоже содержит сайты (один или несколько), у каждого из которых есть определенное имя. Доступ к этим сайтам осуществляется, как обычно: вы указываете в адресной строке URL - обычно имя сайта и путь к документу на нем:
Рис. 1.3.2 URL адрес
Уже при сравнении этих двух картинок можно видеть, что при открытии страницы "через браузер" пользователь в общем случае видит совсем не то же самое, что при открытии файла (сравните хотя бы заголовки окон).
Кстати, на последней картинке имя сайта - dklab. Конечно, такое имя выглядит несколько странно - у него нет суффикса.ru, что делает его недоступным для всех остальных пользователей Сети. Однако на локальной машине сайт открывается замечательно, к тому же, я никогда не спутаю dklab.ru (сайт в Интернете) cdklab (сайт на локальной машине).
MONGODB. База данных с NOSQL архитектурой
MONGODB - документо-ориентированная система управления базами данных (СУБД) с открытым исходным кодом, не требующая описания схемы таблиц.
При разработке авторы исходили из необходимости специализации баз данных, благодаря чему им удалось отойти от принципа "один размер подо все". За счет минимизации семантики для работы с транзакциями появляется возможность решения целого ряда проблем, связанных с недостатком производительности, причем горизонтальное масштабирование становится проще. Используемая модель документов хранения данных (JSON/BSON) проще кодируется, проще управляется (в том числе за счет применения т. н. "бессхемного стиля" (англ. schemaless style)), а внутренняя группировка релевантных данных обеспечивает дополнительный выигрыш в быстродействии. Нереляционный подход весьма удобен для создания баз данных, у которых горизонтальное масштабирование подразумевает разворачивание на множестве машин. Возможность обеспечивать наилучшую производительность должна существовать параллельно с поддержкой более обширной функциональности, чем это позволяет использование пар "ключ-значение" (в чистом виде). Технология баз данных должна работать везде, начиная с серверов пользователя и виртуальных машин и заканчивая облачными технологиями.
MONGODB, по мнению разработчиков, должна заполнить разрыв между простыми хранилищами данных типа "ключ-значение" (быстрыми и легко масштабируемыми) и большими РСУБД (со структурными схемами и мощными запросами).
Основные возможности данной СУБД: · Документо-ориентированное хранилище (простая и мощная JSON-подобная схема данных)
· Достаточно гибкий язык для формирования запросов
· Динамические запросы
· Полная поддержка индексов
· Профилирование запросов
· Быстрые обновления "на месте"
· Эффективное хранение двоичных данных больших объемов, напр., фото и видео
· Журналирование операций, модифицирующих данные в БД
· Поддержка отказоустойчивости и масштабируемости: асинхронная репликация, набор реплик и шардинг
· Может работать в соответствии с парадигмой MAPREDUCE
· Полнотекстовый поиск, в том числе на русском языке, с поддержкой морфологии
СУБД управляет наборами JSON-подобных документов, хранимых в двоичном виде в формате BSON. Хранение и поиск файлов в MONGODB происходит благодаря вызовам протокола GRIDFS. Подобно другим документо-ориентированным СУБД (COUCHDB и др.), MONGODB не является реляционной СУБД. Среди других отличий от традиционных реляционных СУБД: · Отсутствует оператор "join". Обычно данные могут быть организованы более денормализованным способом, но на разработчиков ложится дополнительная нагрузка по обеспечению непротиворечивости данных.
· Нет такого понятия, как "транзакция". Атомарность гарантируется только на уровне целого документа, т.е. частичного обновления документа произойти не может.
· Отсутствует понятие "изоляции". Любые данные, которые считываются одним клиентом, могут параллельно изменяться другим клиентом.
PHP. Серверный язык программирования
PHP - скриптовый язык программирования общего назначения, интенсивно применяемый для разработки веб-приложений. В настоящее время поддерживается подавляющим большинством хостинг-провайдеров и является одним из лидеров среди языков программирования, применяющихся для создания динамических вебсайтов .
Язык и его интерпретатор разрабатываются группой энтузиастов в рамках проекта соткрытым кодом . Проект распространяется под собственной лицензией , несовместимой с GNU GPL.
JAVASCRIPT, как инструмент интерактивности
JAVASCRIPT - прототипно-ориентированный сценарный язык программирования. Является диалектом языка ECMASCRIPT.
JAVASCRIPT обычно используется как встраиваемый язык для программного доступа к объектам приложений. Наиболее широкое применение находит в браузерах как язык сценариев для придания интерактивности веб-страницам.
Основные архитектурные черты: динамическая типизация, слабая типизация, автоматическое управление памятью, прототипное программирование, функции как объекты первого класса.
На JAVASCRIPT оказали влияние многие языки, при разработке была цель сделать язык похожим на Java, но при этом легким для использования непрограммистами. Языком JAVASCRIPT не владеет какая-либо компания или организация, что отличает его от ряда языков программирования, используемых в веб-разработке.
Ajax
AJAX - не самостоятельная технология, а концепция использования нескольких смежных технологий. AJAX базируется на двух основных принципах: · использование технологии динамического обращения к серверу "на лету", без перезагрузки всей страницы полностью, например: 0 с использованием XMLHTTPREQUEST (основной объект);
0 через динамическое создание дочерних фреймов;
0 через динамическое создание тега http://ru. wikipedia.org/wiki/AJAX - cite_note-JSHTTPREQUEST-2 .
0 через динамическое создание тега , как это реализовано в google analytics.
· использование DHTML для динамического изменения содержания страницы;
Действия с интерфейсом преобразуются в операции с элементами DOM (англ. Document Object Model), с помощью которых обрабатываются данные, доступные пользователю, в результате чего представление их изменяется. Здесь же производится обработка перемещений и щелчков мышью, а также нажатий клавиш. Каскадные таблицы стилей, или CSS (англ. Cascading Style Sheets), обеспечивают согласованный внешний вид элементов приложения и упрощают обращение к DOM-объектам. Объект XMLHTTPREQUEST (или подобные механизмы) используется для асинхронного взаимодействия с сервером, обработки запросов пользователя и загрузки в процессе работы необходимых данных.
Три из этих четырех технологий - CSS, DOM и JAVASCRIPT - составляют DHTML (англ. Dynamic HTML). По мнению некоторых специалистов средства DHTML, появившиеся в 1997 году, подавали большие надежды, но так и не оправдали их.
В качестве формата передачи данных могут использоваться фрагменты простого текста, HTML-кода, JSON или XML.
JQUERY
JQUERY - библиотека JAVASCRIPT, фокусирующаяся на взаимодействии JAVASCRIPT и HTML. Библиотека JQUERY помогает легко получать доступ к любому элементу DOM, обращаться к атрибутам и содержимому элементов DOM, манипулировать ими. Также библиотека JQUERY предоставляет удобный API для работы с AJAX. электронный филологический словарь база
Структурные составляющие программы
Специфика словарной статьи
Целью разработки программного обеспечения является создание необходимого функционала работы со словарными статьями филологического словаря: добавление, редактирование, удаление статьей, их распечатка и поиск по данным статьей.
На первоначальном этапе разработки была определена структура словарной статьи, которая приняла следующие очертания Рис. 2.1.1:
Рис. 2.1.1 Структура словарной статьи
Как видно на рисунке, структура статьи состоит из заглавного слова (MYARTICLE), которое может содержать окончания (ending, типа String), лингвокультурологический комментарии (lingv_com, объект класса Word), картинка (picture, типа String), а также объект Word, описанный ниже.
Далее, в соответствии с рис.2.1.1 в структуре следует объект Semantics (возможные значения слова MYARTICLE), который состоит из следующих атрибутов: · Sem - текст семантики (String);
· Word_key - id семантики (String);
· Latin - интерпретация на латинском языке (String);
· Synonim, Variant, Derivat - возможные производные слова от семантики, соответственно: синоним, вариант, дериват. (тип: объект классов Synonim, Variant, Derivat, которые описаны чуть ниже).
В соответствии с техническим заданием существовала необходимость обозначения ударений в слове, а также в других структурных единицах (примеры, прецедентные высказывания и др.). Подобный механизм сохранения ударений в словах был реализован с помощью создания объекта Word, который содержит два атрибута: это data - сам строка, и accents - ударения в виде массива позиций вхождения ударной буквы в строку. Данный объект, встречается везде, где существует необходимость сохранения ударений в строке, а это поля в объектах: · MYARTICLE - свойство article;
· Synonim - свойство text;
· Variant - свойство text;
· Derivat - свойство text;
· Variant_use - свойство data (не всегда).
Специфика словарной статьи заключается в возможности существования или не существования отдельных слов (Synonim, Variant, Derivat) относящихся к каждой семантике словарного слова (MYARTICLE). Также, у каждого слова (Synonim, Variant, Derivat), могут существовать, или не существовать следующие атрибуты: · text - само слово (объект Word) - обязательное поле;
· meaning - уточняющее значение (объект Word);
· part_of_speach - часть речи (String);
· gender_ex - род (String);
· amount_word - число (String);
· padej - падеж (String);
· class_of_word - разряд (String);
· degree_of_concruence - степень сравнения (String);
· type - вид (String);
· mood - наклонение глагола (String);
· gram_pomet - грамматические пометы (Array);
· stil_pomet - стилистические пометы (Array);
· word_key - id слова (String);
· v_u - вариант использования (объект Varaint_Use).
Каждое слово (Synonim, Variant, Derivat), может содержать специфический объект - Variant_Use. Данный объект, в структуре статьи, может содержать: · иллюстраций;
· переносные значения;
· прецедентных высказываний;
· сочетаемость;
· устойчивые или фразеологические сочетания.
Иллюстрации и прецедентные высказывания, помимо основных полей (а это data - объект Word, и type, типа String), могут содержать объект типа Informer_Pasport. Этот объект - паспорт информанта, содержит краткую информацию о человеке, предоставившем информацию об иллюстрации или прецедентом высказывании. Данный объект состоит из полей: · fio_ - фамилия имя отчество (String);
· gender_ - пол (String);
· age_ - возраст (String);
· year_ - год записи (String);
· educ_ - образование (String);
· dialect - диалект (String);
· address - адрес, данный объект описан ниже (объект Adress).
Существует необходимость в адресе, где произошла запись, поэтому был создан класс, содержащий всю подробную информацию - Adress. Данный класс может существовать только в случае наличия информации об информанте. Максимально заполненный адрес будет обладать следующими полями: · place - местность (String);
· region - область (String);
· district - район (String);
· settlement - населенный пункт (String).
Структура программы
При запуске программы (вход на сайт) пользователь видит главное окно программы рис. 2.2.1:
Рис 2.2.1 Главное окно программы.
На текущий момент вы можете просмотреть добавить, и удалить словарную статью. Функционал редактирования и просмотра пока недоступен. Поиск осуществляется в списке по названию статьи.
Добавление статьи осуществляется в следующей форме ввода рис. 2.2.2:
Рис. 2.2.2 Форма ввода статьи
Здесь вы можете добавить статью, окончания, выбрать род, загрузить иллюстрацию, добавить лингвокультурологический комментарий. Также есть возможность добавлять семантики на русском и латинском языке.
Справа отображена статья в виде дерева.
Добавление семантик, вариантов и дериватов происходит на следующей форме рис. 2.2.3:
Рис. 2.2.3 Форма ввода синонима, варианта, деривата.
Как вы видите, здесь имеются функционал для заполнения всех полей, описанных в предыдущем параграфе. Заполнение иллюстраций и прецедентных высказываний осуществляется в следующей форме ввода рис. 2.2.4:
Рис. 2.2.4 Форма ввода иллюстраций.
Взаимодействие с базой данных
Главное окно записи статьи находится в файле article. php. После того как форма ввода заполнена, пользователь нажимает на кнопку "записать статью" в результате, скрипт перенаправляет программу на тот же файл article. php. Строки представленные ниже (рис. 2.3.1) демонстрируют соединение и запись статья в базу данных.
Рис 2.3.1 Код записи коллекции в базу данных
Выборка и заполнение полей списка представлена на рис. 2.3.2.
Рис 2.3.2 Код выборки и заполнения данных в главное окно программы
Вывод
В результате разработки программного обеспечения удалось настроить не реляционную базу MONGODB, подключится к ней через браузер для чтения и добавления новых данных.
При разработке формы вводы удалось ознакомиться с языком программирования JAVASCRIPT, с помощью которого и был осуществлен весь интерактивный функционал ввода данных.
Php использовался в нескольких случаях: · Подключение к базе данных;
· Чтение данных из базы;
· Удаление статьи;
· Добавление статьи;
· Переход между окнами программы.
При разработке также интенсивно использовалась библиотека JQUERY, которая позволила существенно сократить код программы и упростила процесс написания кода.
С помощью технологии Ajax была реализована возможность интерактивной загрузки изображения. Ajax использовалась в совокупности с библиотекой JQUERY.
Несмотря на отсутствие некоторых функций, которые планируется реализовать, основные поставленные задачи были выполнены успешно.
Список литературы
1. Дэвид Флэнаган - JAVASCRIPT. Подробное руководство. - Пер. с англ. - СПБ: СИМВОЛЛПЛЮС, 2008. - 992 с., ил.
2. Ларри Ульман - Основы программирования на PHP. М.: ДМК Пресс, 2011 г. 288 с.
Размещено на
Вы можете ЗАГРУЗИТЬ и ПОВЫСИТЬ уникальность своей работы