четверг, 2 октября 2014 г.

Голосовой контроль плеера AIMP с помощью Google Speech Recognize API

Данная библиотека предназначена для голосового управления плеером AIMP и представляет собой плагин к данному плееру, согласно SDK. Работа плагина основана использовании сервиса GoogleSpeech Recognize через библиотеку авторской разработки GoogleSpeechRecognizeAPI3.DLL. Распознавание осуществляется REALTIME в автоматическом режиме, по задаваемому пользователем пороговому уровню шума и задержке отслеживания окончания фразы (триггера "тишины"). Для корректной работы плагина обязательно наличие Интернет-канала и качественного микрофона, максимально изолированного (для исключения забития канала) от воздействия звуков проигрываемой плеером AIMP музыки. Идеальным вариантом такого микрофона может стать радиомикрофон и FM-приемник или Bluetooth-гарнитура, либо в наш век цифровых технологий установленный VoIP клиент, к примеру мультиплатформенный Zello, на вашем смартфоне c Wi-Fi и ПК. Тогда вы cможете свободно ходить по квартире/офису и отдавать плееру голосовые команды без влияния посторонних звуков и проводов. Удобно? То-то же.

 
 
Cистемные требования и зависимости:
  1. Win32/64 (NT/2003/XP/7/8/10).
  2. Требуется наличие Интернет-канала.
  3. Качественный микрофон (не внутренний!) или гарнитура/блютуз-гарнитура.
ПОРЯДОК ИСПОЛЬЗОВАНИЯ
  1. Подключите ваш микрофон или гарнитуру/блютуз-гарнитуру (используя аудио-шлюз) и убедитесь в его/ее работоспособности (в Windows 7/8/10 несколько микрофонов).
  2. Под Windows 7/8 любой битности (32/64) проведите запуск скрипта 'adminregOS32-64.bat' правой кнопкой мыши от имени Администратора.
  3. Скопируйте содержимое архива (сам плагин 'aimp_VoiceControl.dll' и рабочую папку 'aimp_VoiceControl' в каталог 'plugins' плеера AIMP.
  4. Через меню настроек плеера активируйте плагин 'aimp_VoiceControl.dll' или просто перезапустите плеер.
  5. В момент запуска плеера рядом с плагином появится (автосоздание) файл настроек 'aimp_VoiceControl.ini', вы можете в любой момент времени изменять следующие настройки во время работы плеера (плагина):
GOOGLEAPIKEY=  - API ключ Google для доступа к сервису (можно задавать свой)
Threshold_Level=20 - пороговый уровень срабатывания "триггера тишины" начала фразы, %
Delay_Off=1000    - величина задержки отключения "триггера тишины" окончания фразы, мс
Lang=RU        - язык распознавания (забит русский)
Next=1        - любая фраза/слово/цифра для перехода на следующий трек
Prev=2        - любая фраза/слово/цифра для перехода на предыдущий трек
Pause=3        - любая фраза/слово/цифра для операции Play/Pause
Volume_Up=4        - любая фраза/слово/цифра для повышения громкости
Volume_Down=5        - любая фраза/слово/цифра для снижения громкости
Report=ON        - флаг визуализации работы плагина на рабочем столе (результат распознавания и выполнения команды)
Видеоинструкция по использованию AIMP_VoiceControl.DLL в Windows 7/64bit:


Видеоинструкция по использованию AIMP_VoiceControl.DLL в Windows 8/64bit:

 
cкачать

Авторские плагины под AIMP
  1. Голосовой контроль плеера с помощью Microsoft SAPI (не требует Интернет)
  2. Голосовой контроль плеера с помощью Google Speech Recognition API (требует Интернет)
  3. Плагин паузы по звонку Skype для AIMP
  4. Плагин "умной" паузы для AIMP в условиях коротких и длительных шумовых воздействий окружающей обстановки

1 комментарий:

  1. В связи с нововведениями Google архив AIMP_VoiceControl.DLL обновлен.

    ОтветитьУдалить

В комментариях уважайте собеседника, внимательно читайте посты и не додумывайте. Просьбы и предложения из разряда: «можно ваш Skype/Viber/телефон», «напишите мне в vk/FB», а также другие им подобные — игнорируются. Выход новых версий ПО, внешняя ссылка, переставшая работать с течением времени и т.п. не является основанием для претензий. Желающие спокойно подискутировать и высказаться — Welcome. Желающие спонсировать блог — Donate. Нарушение этих простых правил ведет к бану и удалению комментариев без предупреждения.