Системы речевого ввода и вывода информации

Читайте также:

Существует две технологии речевого общения с компьютером:

· системы распознавания речи;

· системы синтеза речи.

Системы распознавания речи

В системах распознавания речи выполняется оцифровка звуковой информации, ее идентификация с кодами, содержащимися в электронных словарях, необходимая автоматическая коррекция кодов и генерация соответствующих им символов, слов и предложений, вывод текстов на экран, запись текстов в память машины или исполнение команд.

По характеру распознаваемой речи подразделяются:

· системы распознавания слов, команд и вопросов;

· системы распознавания предложений и связной речи;

· системы идентификации по образцу речи.

Системы распознавания слов, команд и вопросов называют системами речевого управления, они получили распространение в автоматических телефонных службах. Сегодня используются системы третьего поколения, строящие диалог с пользователем с помощью системы голосовых меню. Такие системы основаны на идее обучения: в течение некоторого времени система обучается на большом количестве типовых речевых диалогов. В ходе этого обучения строится рабочий словарь и база данных отношений между отдельными словами.

Системы распознавания предложений и связной речи

Системы этой группы делятся на системы раздельной диктовки и системы распознавания связной речи.

Системы раздельной диктовки проще в разработке и реализации, но они требуют от пользователя короткой паузой перед каждым следующим словом. При произнесении связной речи больше сказывается эмоциональная составляющая вводимой информации, и при произношении слов изменяется их звучание.

Системы идентификации по образцу речи

Идентификация по образцу речи относится к биометрическим технологиям идентификации человека, таким как отпечатки пальцев и т.д. Цель системы — идентифицировать конкретного известного системе пользователя. Идентификация состоит из трех этапов:

· регистрация пользователя с целью запоминания особенностей его голоса;

· тестирование для сравнения образца речи;

· допуска к работе в системе.

Механизм распознавания речи состоит из четырех блоков:

· препроцессора;

· экстрактора;

· компаратора;

· интерпретатора.

Препроцессор обеспечивает приведение речевого сигнала к наиболее качественному виду.

Экстрактор выполняет спектральный анализ сигнала (примерно по 10 мс).

Компаратор выполняет акустическое сравнение выявленных характеристик каждого кадра с имеющимися образцами.

Интерпретатор решает задачу наилучшего разбиения полученного компаратора потока на слова и фразы.

Дата добавления: 2014-12-15; просмотров: 72 | Поможем написать вашу работу | Нарушение авторских прав

123 4

lektsii.net - Лекции.Нет - 2014-2024 год. (0.006 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав