Состояние проблемы автоматического распознавания речи. Обзор устройств чтения аудио сигналов. Архитектура системы управления периферийными устройствами. Схема управления электрическими устройствами. Принципиальная схема включения электрических устройств.
Аннотация к работе
В настоящее время вычислительная техника используется во многих областях человеческой деятельности, являясь удобным и многофункциональным инструментом для решения широкого круга задач. Однако, в настоящее время пользователи ЭВМ вынуждены использовать способы взаимодействия, слабо адаптированные к возможностям человеческого общения и ограничивающие способности человека к обмену информацией. Основная цель усовершенствования и развития интерфейса человек-компьютер заключается в организации обмена информацией с ЭВМ таким образом, чтобы: - Снизить время освоения программных и аппаратных средств; Человек наделен большим количеством возможностей воспринимать и передавать информацию: зрение, слух (в том числе устная речь), жесты и движения, мимика, осязание и другими. Воспринимать информацию естественными для человека способами (распознавать речь, жесты, мимику и т.д.) современные средства интерфейса практически не в состоянии.Процесс распознавания речи представляет собой преобразование акустического сигнала, полученного от микрофона, в последовательность слов. Во-первых, человек обычно не делает паузы между словами, а при слитном произнесении к задаче распознавания прибавляется еще и задача выделения слов из потока речи, что заведомо более сложно. Можно потребовать, чтобы человек произносил слова по одному, делая достаточно продолжительные паузы или чтобы каждое следующее слово произносилось после звукового сигнала. Размеры словаря при работе с настройкой на диктора (speaker-dependent) в настоящее время могут достигать нескольких (и даже многих) тысяч слов при слитном произнесении. Процедура настройки на диктора выглядит следующим образом: диктор читает некий специальным образом составленный текст, компьютер распознает слова и выдает вариант распознавания.Сегодняшние микрофоны преобразуют колебания воздуха в электрический сигнал, и хотя эта теория лежит в основе работы всех микрофонов, их различия заключаются в процессах производящих эти преобразования. Устойчивость к громким звукам позволяет использовать эти микрофоны для снятия звуков ударов. Таким образом, попадающая в микрофон акустическая энергия преобразуется в электрическую, при этом, форма электрического тока соответствует характеру звуковых колебаний. Особенности внутреннего устройства динамических микрофонов ограничивают количество возможных типов диаграмм направленности: такие микрофоны могут быть только однонаправленными или всенаправленными. Конденсатор этого микрофона не использует никакого электрического тока, и поэтому эти микрофоны характеризуются сравнительно невысокой стоимостью.С точки зрения сопротивления различают высокоомные (10-50 КОМ) и низкоомные (50-600 Ом) микрофоны. Этот микрофон применяют при маловероятной в любительских условиях многомикрофонной записи для четкого разделения групп звуков, а также при размещении источника звука близко к микрофону, чтобы снизить низкочастотные искажения, присущие в этом случае ненаправленному и двусторонне направленному микрофонам. Двусторонне направленный микрофон с диаграммой типа «восьмерка» следует применять при записи в заглушенном помещении, когда необходимо увеличить относительный уровень переотраженных сигналов, а также при записи отдельных звуков и голосов для выделения низких частот в условиях близкого размещения, источников звуков у микрофона. Понятие «прямое звуковое поле» описывает тот случай, когда звук достигает микрофон, не отражаясь предварительно от стен, потолка пола или других поверхностей (см. рис. Понятие «отраженное (реверберационное) звуковое поле» описывает ситуацию, когда звук, перед тем, как достигнуть микрофон, отражается о стены, потолок, пол или другие поверхности (см. рис.Вечно забывает выключить свет или обогреватель и вспоминает об этом прискорбном факте в самом неожиданном месте и, как правило, далеко от дома. И вообще если, например, ужасно не хочется вылезать изпод теплого одеяла, если вдруг спохватываешься, что не выключен кондиционер или вентилятор… Называем: «АББ» (ABB), «СИМЕНС» (SIEMENS), «ЛЕГРАН» (LEGRAND), «БОШ» (BOSCH), «АКЕРМАН» (ACKERMANN), «ФИЛИПС» (PHILIPS) и еще около сотни ведущих европейских производителей, выпускающих технику и приборы для дома и офиса. Примерно десять лет назад они объединились и создали Ассоциацию EIBA (European Installation Bus Association) с торговой маркой EIB (European Installation Bus), что переводится как Европейская инсталляционная шина. В результате этого объединения произошла замечательная вещь - стандарт EIB обеспечивает полную совместимость всех устройств и, как объясняют специалисты, обмен информацией между ними.Архитектурная схема умной системы представлена на рис 2.1. Устройства, следящие за человеком (микрофоны, видеокамеры, сенсоры и др.) располагаются по всей комнате (зданию) и постоянно сканируют, исходящие от человека звуки и проделываемые им жесты, обрабатывая их в блоке обработки аудио и видео сигналов (чем больше количество этих устройств, тем лучше и точнее он распознается) [22].Схема голосового управления эле
План
Содержание
Введение
ГЛАВА 1. ГОЛОСОВОЕ УПРАВЛЕНИЕ техническими устройствами
1.1 Состояние проблемы автоматического распознавания речи
1.2 Обзор устройств чтения аудио сигналов
1.3 Подбор устройств для разработки аудиосистемы
ГЛАВА 2. МОДЕЛЬ ГОЛОСОВОГО УПРАВЛЕНИЯ ПЕРИФЕРИЙНЫМИ УСТРОЙСТВАМИ
2.1 Предпосылки к созданию «умной» системы
2.2 Архитектура системы управления периферийными устройствами
3.2 Принципиальная схема внутреннего источника питания
3.3 Область применения
ГЛАВА 4. ЭКОНОМИЧЕСКАЯ ЧАСТЬ
ГЛАВА 5. БЕЗОПАСНОСТЬ ЖИЗНЕДЕЯТЕЛЬНОСТИ
Заключение
Список использованных источников
Введение
В настоящее время вычислительная техника используется во многих областях человеческой деятельности, являясь удобным и многофункциональным инструментом для решения широкого круга задач. Однако, в настоящее время пользователи ЭВМ вынуждены использовать способы взаимодействия, слабо адаптированные к возможностям человеческого общения и ограничивающие способности человека к обмену информацией. Основная цель усовершенствования и развития интерфейса человек-компьютер заключается в организации обмена информацией с ЭВМ таким образом, чтобы: - Снизить время освоения программных и аппаратных средств;
- Снизить уровень ошибок при передаче информации;
- Сделать работу с ЭВМ возможной для людей, не имеющих возможности пользоваться традиционными средствами интерфейса;
- Снизить утомляемость, увеличить субъективное удовлетворение пользователя от работы;
Для достижения поставленных целей необходимо применение средств взаимодействия, более полно использующих коммуникативные способности человека. Человек наделен большим количеством возможностей воспринимать и передавать информацию: зрение, слух (в том числе устная речь), жесты и движения, мимика, осязание и другими. Во взаимодействии человека и компьютера существуют два информационных потока: - управляющие команды и данные, передаваемые компьютеру для обработки;
- результаты вычислений и другая информация, представляемая компьютером пользователю.
Распространенный в настоящее время человеко-машинный интерфейс использует зрение, как основной канал представления информации пользователю, отображая данные в виде условных знаков на экране компьютера. Воспринимать информацию естественными для человека способами (распознавать речь, жесты, мимику и т.д.) современные средства интерфейса практически не в состоянии.
Лицо человека является важным источником информации при общении между людьми. Выражение лица, мимика, артикуляция при разговоре, движения головой являются удобным, естественным и, что важно, необременительным способом передачи информации. Неспособность компьютера с одной стороны воспринять, а с другой стороны воспроизвести столь естественные для человека способы общения затрудняет передачу и восприятие информации при работе с ЭВМ.
Для обеспечения эффективного речевого диалога между пользователем и ЭВМ необходимы устойчивые системы распознавания речи.
Основной целью дипломной работы является разработка системы голосового управления электромеханическими устройствами. Разработанная в результате работы система совместно с работой базы данных обеспечат основу для последующей разработки модели многомодального распознавания больших словарей русской речи и выполнения множества речевых команд.