Посты с метками "speechapi"

Вышла моя книга «MS Agent и Speech API в Delphi»

В издательстве БХВ-Петербург  вышла моя книга «MS Agent и Speech API в Delphi«(+CD-ROM).  Серия Профессиональное программирование

Butorin_MSA_n_SAPI_in_Delphi

ISBN 5-94157-502-5

Формат 70х100 1/16

Объем 448 стр.

Цена* 194 руб.
* Цена приведена для магазина «Новая техническая книга» (Измайловский пр., д. 29).

Аннотация

Рассмотрено программирование нестандартных пользовательских интерфейсов в среде Delphi с применением технологий Microsoft Agent и Microsoft Speech API для операционных систем Windows 98/2000/XP. Представлены способы внедрения анимированных персонажей в приложения Delphi и использования методов синтеза и распознавания речи с помощью функций Speech API. Подробно рассмотрены речевые интерфейсы высокого и низкого уровней. Описан процесс создания собственных анимированных персонажей и использования нестандартной текстовой выноски BalloonDialog. На компакт-диске помещены все примеры, описанные в книге, необходимые компоненты и модули для создания приложений, а также программы автора, созданные с использованием описанных в книге технологий.

Краткое содержание

Введение
Глава 1. Технологии COM, OLE и ActiveX
Глава 2. Технология MS Agent в среде Delphi
Глава 3. Технология Speech API в среде Delphi
Глава 4. «Примочки» к MS Agent
Заключение
ПРИЛОЖЕНИЯ
Приложение 1. Ссылки на сайты и файлы в Интернете
Приложение 2. Описание компакт-диска
Список литературы
Предметный указатель

Заказывайте книгу в магазинах торговой сети!

Интернет-магазин ozon.ru: http://www.ozon.ru/context/detail/id/2162742/

Speech API 4. Работа с голосом

Эта статья об управлении параметрами чтения чтекстов в Delphi функциями SpeechAPI.

Надеюсь, что вы прочитали первую часть SpeechAPI в Delphi и статью MSAgent и SpeechAPI, поэтому перейду непосредственно к способу управления параметрами чтения. Я опишу общий способ управления, а затем рассмотрим разницу управления параметрами речи при чтении методом Speak у MSAgent и чтением функциями API напрямую.

Теги

Как пишут в буржуйской офицальной документации к Microsoft Speech API: SAPI поддерживает изменения речевого вывода через специальные теги,вставляемые в читаемую текстовую строку. Эти теги помогают изменять параметры голосового движка для улучшения трансляции текста в речь. Поддерживает теги не только речевые движки, но и MSAgent. Теги — это основной способ управления голосовыми возможностями речевого синтезатора. Например: \spd=100\ — этот тег изменяет скорость речи на значение равное 100. Вот некоторые правила синтаксиса для речевых тегов:

  • Все теги начинаются и заканчиваются символом наклонной черты влево (\).
  • Отдельный бэкслэш не допускается в пределах тэга. Чтобы включить бэкслэш в текстовый параметр тэга, используйте двойную наклонную черту влево (\\).
  • Теги воспринимаются без учета регистра. Например, \Spd=100\ — тот же самый что и \SPD=100\.
  • Теги пробеловосприимчивы, то есть не допускают в себе лишних пробелов. Например, \Rst\ — не тот же самый что и \ Rst \

MSAgent поддерживает следующие теги: Chr, Ctx, Emp, Lst, Map, Mrk, Pau, Pit, Rst, Spd, Vol. При чтении через SAPI этот набор немного шире. Теги создавались для корректировки преобразования текста в речь, но некоторые из них изменяют стиль голоса, например на шепот. Поэтому одни из них имеют параметры, а у других они отсутствуют, как у тега \Emp\. А теперь подробнее про
каждый из них!

Читать далее

Speech API 4 в Delphi

В этой статье мы познакомимся с программированием речи в Delphi. Хотите чтобы Delphi заговорил — читайте эту страницу!

MSAgent & SpeechAPI

Нудеюсь, что вы уже установили пакет функций Speech API и хотя бы один речевой движок. Речевые движки — это те модули, которые синтезируют речь. Для доступа к ним нужно использовать специальные функции, которые описаны в наборе функций Speech API. Поэтому для того, чтобы написать минимальную программу умеющую говорить, нужны эти два компонента. Сначала мы попробуем написать как раз эту программу-минимум а потом заставим персонаж MS Agent заговорить. То есть постараемся совместить технологию MSAgent и SpeechAPI. Тогда агент станет еще более приятным.

Ну, а для того чтобы всем эти заняться нам потребуется полезный модулек speech.pas, в котором объявлены полезные константы, типы, функции и интрефейсы. Не забудьте подключить его в разделе uses главного модуля приложения.

Читать далее