Читайте также:
|
|
Существует две технологии речевого общения с компьютером:
· системы распознавания речи;
· системы синтеза речи.
Системы распознавания речи
В системах распознавания речи выполняется оцифровка звуковой информации, ее идентификация с кодами, содержащимися в электронных словарях, необходимая автоматическая коррекция кодов и генерация соответствующих им символов, слов и предложений, вывод текстов на экран, запись текстов в память машины или исполнение команд.
По характеру распознаваемой речи подразделяются:
· системы распознавания слов, команд и вопросов;
· системы распознавания предложений и связной речи;
· системы идентификации по образцу речи.
Системы распознавания слов, команд и вопросов называют системами речевого управления, они получили распространение в автоматических телефонных службах. Сегодня используются системы третьего поколения, строящие диалог с пользователем с помощью системы голосовых меню. Такие системы основаны на идее обучения: в течение некоторого времени система обучается на большом количестве типовых речевых диалогов. В ходе этого обучения строится рабочий словарь и база данных отношений между отдельными словами.
Системы распознавания предложений и связной речи
Системы этой группы делятся на системы раздельной диктовки и системы распознавания связной речи.
Системы раздельной диктовки проще в разработке и реализации, но они требуют от пользователя короткой паузой перед каждым следующим словом. При произнесении связной речи больше сказывается эмоциональная составляющая вводимой информации, и при произношении слов изменяется их звучание.
Системы идентификации по образцу речи
Идентификация по образцу речи относится к биометрическим технологиям идентификации человека, таким как отпечатки пальцев и т.д. Цель системы — идентифицировать конкретного известного системе пользователя. Идентификация состоит из трех этапов:
· регистрация пользователя с целью запоминания особенностей его голоса;
· тестирование для сравнения образца речи;
· допуска к работе в системе.
Механизм распознавания речи состоит из четырех блоков:
· препроцессора;
· экстрактора;
· компаратора;
· интерпретатора.
Препроцессор обеспечивает приведение речевого сигнала к наиболее качественному виду.
Экстрактор выполняет спектральный анализ сигнала (примерно по 10 мс).
Компаратор выполняет акустическое сравнение выявленных характеристик каждого кадра с имеющимися образцами.
Интерпретатор решает задачу наилучшего разбиения полученного компаратора потока на слова и фразы.
Дата добавления: 2014-12-15; просмотров: 72 | Поможем написать вашу работу | Нарушение авторских прав |