Текст: представление, хранение, ввод. Оформление, структурирование, автоматизированная обработка и системы автоматизированной доработки текста. Понятие “текстового файла”. Пример текстовых редакторов. Параметры характеристики и основные виды шрифта.
Энциклопедический словарь дает такое определение понятию “текст”: “Текст - это упорядоченный набор слов, предназначенный для того, чтобы выразить некий смысл. Поскольку компьютер работает только с двоичным кодом, то для записи и обработки требуется взаимно-однозначно сопоставить символы и двоичные коды. Правило сопоставления кодов и символов, входящих в алфавит, называется кодировкой. Первый широко распространенный стандарт кодирования - таблица (т.е. прямое сопоставление кодов символам) кодировки ASCII (American Standard Code for Information Interchange , американский стандартный код для обмена информацией) - был разработан в 1963 году. Применение такого способа кодирования сильно затрудняет передачу текстовых сообщений между разными странами, объединение в сообщении текста на нескольких языках, а в случае с русским языком - и обмен файлами между разными ОС (для русского языка до сих пор активно применяется 4 разных кодовых таблицы).Шрифт - это графический рисунок букв, цифр и символов, обладающий общими для всех символов стилистическими особенностями изображения. Шрифт характеризуется рядом параметров: 1. Начертание - шрифт с общим рисунком, но какими-либо отличительными признаками: более жирный, наклонный, разреженный. Совокупность всех возможных размеров и вариантов написания шрифта называется гарнитурой. По общим чертам рисунка различают три основных вида шрифтов: Шрифт задается для набранного текста и не изменяет самих символов - он только определяет написание каждого символа, исходя из эталонного изображения.Как и в литературе, в компьютерном тексте абзацем называется выделенный по смыслу участок. Различают межстрочное расстояние - задается множителем размера шрифта (одинарный, полуторный, двойной интервал) - и промежутки до и после абзаца. Абзацы размещаются в рамках полосы - выделенного участка страницы, как правило, прямоугольной формы, в котором размещаются текст и иллюстрации. Как правило, в достаточно большом (больше нескольких страниц) тексте выделяется несколько смысловых блоков (разделов) и видов содержательного текста - обычный текст, примечания, ссылки и т.п. Применение стилей позволяет ускорить набор, автоматизировать оформление (например, автоматически создавать оглавления) и изменять внешний вид различных элементов, не разыскивая их по всему тексту.Связано это с тем, что в этой форме информация представляется в виде близком к исходному языку, что позволяет выполнять преобразования, связанные со смыслом текста. Существует несколько наиболее распространенных автоматизированных операций, связанных с текстовым представлением. Задача поиска необходимой информации чаще всего формулируется как поиск фрагментов, содержащих некоторые понятия, в достаточно большом массиве. Существует несколько подходов к организации такого поиска. Первый подход опирается на поиск фрагмента текста, соответствующего некоторому образцу.Для решения такой задачи в самых разных видах применяют словари - базы информационных фрагментов, связанных с некоторыми ключевыми словами или словосочетаниями. Особым видом словарей являются тезаурусы - словари, в которых слова связываются на основе каких-либо лексических отношений.Используя закономерности естественного языка и описанные выше средства выполнения некоторых операций и выявления зависимостей, с помощью ЭВМ автоматизируют некоторые операции по смысловому преобразованию текста. Современные системы обработки позволяют создавать краткие обзоры текстов (рефераты) или готовить перевод с одного естественного языка на другой.
План
Оглавление
1. Текст: представление, хранение, ввод
2. Оформление текста
2.1 Структурирование теста
3. Автоматизированная обработка текста
3.1 Расшифровка или уточнение значений слова
3.2 Системы автоматизированной доработки текста
Список использованной литературы
1. Текст: представление, хранение, ввод
Представление текста
Список литературы
1. Потапова Р.К. Новые информационные технологии и лингвистика. М., 2002.
2. Хроленко А.Т., Денисов А.В. Современные информационные технологии для гуманитария. Практическое руководство. Москва издательство «Наука», 2007 г.
4. Потапова Р.К. Новые информационные технологии и лингвистика. М., 2002.
5. Романенко В. Н., Никитина Г. В. Сетевой информационный поиск: Информация в Интернете; Поисковые машины; Электронные каталоги библиотек; Как формулировать запросы: Практическое пособие. - СПБ., 2003
6. Степанов М.Ф. Машинный перевод и общение на естественном языке. Саратов, 2000.
7. Предметный поиск в традиционных и нетрадиционных информационно-поисковых системах: сб. науч. тр. СПБ.: Изд-во РНБ, 2001. Вып. 15. 303 c.
Размещено на .ru
Вы можете ЗАГРУЗИТЬ и ПОВЫСИТЬ уникальность своей работы