Зачисление
Все звучат немного по-разному, поэтому первый шаг в использовании системы распознавания голоса - это чтение статьи, отображаемой на экране. Этот процесс, называемый регистрацией, занимает менее 10 минут и приводит к созданию набора файлов, которые сообщают программе, как вы говорите. Регистрацию необходимо выполнить только один раз, после чего программное обеспечение можно будет запускать по мере необходимости. Новое программное обеспечение утверждает, что процесс регистрации даже проще, чем в предыдущих версиях.
Диктовка и исправление
Во время разговора люди часто колеблются, бормочут или невнятно произносят слова. Один из ключевых навыков использования программного обеспечения для распознавания голоса - это научиться четко говорить, чтобы компьютер мог распознавать то, что вы говорите. Это означает, что вы планируете, что сказать, а затем произносите речь целыми фразами или предложениями. Программа распознавания голоса неправильно поймет некоторые произнесенные слова, поэтому необходимо вычитать, а затем исправить свои ошибки. Исправления можно вносить с мыши и клавиатуры или с голоса. Когда будут внесены исправления, программное обеспечение распознавания голоса адаптируется и обучится, так что та же ошибка больше не повторится. Точность должна улучшиться при тщательной диктовке и исправлении.
Редактирование и форматирование текста
Текст можно очень легко изменить (отредактировать). Текст, который нужно изменить, можно выбрать (выделить) с таких команд, как «выбрать строку», «выбрать абзац», а затем изменения могут быть озвучены в компьютер. Затем они заменят выбранный текст.
Обычно системы распознавания голоса с большим словарным запасом требуют обучения компьютера распознаванию вашего голоса для достижения высокой степени точности. Обучение таким системам включает в себя повторение различных слов и фраз во время тренировки и активное использование системы. Обученные системы регулярно достигают уровня распознавания слов от 95 до 99 процентов. Обучение с точностью до 95 процентов занимает всего несколько часов.
Двумя примерами программного обеспечения для распознавания слитной речи для обработки текстов являются Naturally Speaking от Dragon Systems и Via Voice от IBM.