вторник, 18 мая 2010 г.

Мини-FAQ. Распознавание и синтез речи

Решил скомпоновать собственные наработки и найденные ресурсы по распознаванию и синтезу речи в краткий путеводитель для быстрого старта начинающими.



Фреймворки (синтез и распознавание)
  1. Modular Audio Recognition Framework
  2. Yandex SpeechKit (под Android и iOS)
  3. Yandex SpeechKit (под Windows синтез и распознавание/Описание API вызова библиотеки YandexSpeechRecognition.DLL)
  4. Описание API вызова библиотеки GoogleSpeechRecognizeAPI3.DLL (под Windows синтез и распознавание)
  5. Описание API вызова библиотеки SpeechTranslateSpeech.DLL (переводчик с голосовым вводом на одном языке и речевым синтезом на другом)
  6. Голосовой контроль Wi-Fi розетки Kankun KK-SP3 через VoIP приложение Zello
  7. Голосовой контроль нагрузками HID устройства
  8. Голосовой контроль Arduino по беспроводному BlueTooth-каналу
  9. Голосовой контроль плеера AIMP
  10.  Speech Filing System
  11. Распознавание Google-offline
  12. Голосовой контроль-оффлайн на Arduino. Библиотека Uspeech (без модулей Voice Recognition for Arduino, без EasyVR, без GoogleSpeechRecognition API, все только средствами буратинки) 
ЛИТЕРАТУРА
  1. Научно-практический журнал «Речевые технологии»
  2. Акустический журнал
  3. Дидковский В.С., Дидковская М.В., Продеус А.Н. Акустическая экспертиза каналов речевой коммуникации.
  4. Сорокин. Распознавание личности по голосу (аналитический обзор)
  5. Анализ параметров речевого сигнала, создающих восприятие элементарных звуков речи
  6. Влияние 40% водного раствора этилового спирта на сонограмму человеческого голоса
Распознавание речи
  1. GMM. Text-Independent Speaker Verification 1 2 3 
  2. Метрики для сравнения звуковых сигналов с учетом особенностей человеческого слуха
  3. Получение формант речевого сигнала
  4. Мел-кепстральные коэффициенты (MFCC) и распознавание речи
  5. Простой алгоритм распознавания речи по короткому словарю на основе MFCC
  6. Speech to Text Simon
Синтез речи
  1. Автоматический поиск ключевых слов в непрерывном потоке речи на основе технологии "РАСПОЗНАВАНИЕ ЧЕРЕЗ СИНТЕЗ"
  2. Фонетико-акустическая база данных для многоязычного синтеза речи по тексту на славянских языках
  3. Дикторская база для синтеза речи под движок Festival 
  4. Aquila is a digital signal processing library for C++
  5. Voice: Open Source Speech Interaction
Аппаратные автономные модули распознавания речи
  1. Модули EasyVR. Вводная
  2. Офсайт EasyVR | Документация и софт
  3. Модули SmartVR
  4. Модули Voice Recognition for Arduino  

Комментариев нет:

Отправить комментарий

В комментариях уважайте собеседника, внимательно читайте посты и не додумывайте. Просьбы и предложения из разряда: «можно ваш Skype/Viber/телефон», «напишите мне в vk/FB», а также другие им подобные — игнорируются. Выход новых версий ПО, внешняя ссылка, переставшая работать с течением времени и т.п. не является основанием для претензий. Желающие спокойно подискутировать и высказаться — Welcome. Желающие спонсировать блог — Donate. Нарушение этих простых правил ведет к бану и удалению комментариев без предупреждения.