VoxForge
Нужно рассказать подробно, что именно не работает. Что запускается, что выводится на экране, какая версия pocketsphinx, какая операционная система. Чем больше информации Вы предоставите, тем быстрее получите ответ на вопрос.
Устанавливаю версию для ROS indigo, судя по всему пакет инсталяхи gstreamer0.10-pocketsphins.
Скачиваю русскую модель cmusphinx-ru-5.2, если запускаю с ключем pocketsphinx_countinuous -hmm, -lm, -dict в которых указываю пусть до модели, то все работает, если меняю модель en_us по пути usr/share/pocketsphinx/model/hmm/en_US/hub4wsj_sc_8k/ на файлы которые в русской модели, то из ROS recognizer уже не работает
У меня та же проблема.
У меня есть подозрение,
что надо перекомпилировать sphinxbase и pocketsphinx,
указав в
config = cmd_ln_init()
данные для русской модели, верно?
> что надо перекомпилировать sphinxbase и pocketsphinx,
Не надо, только модуль для ROS нужно менять
> указав в config = cmd_ln_init() данные для русской модели, верно?
Вообще версия в ROS сильно устарела, есть обновление которое почти работает.
https://github.com/vadimreutskiy/pocketsphinx/tree/jade-devel/nodes
На днях мы выложим документацию по использованию.
Добрый день!
Спасибо за http://nshmyrev.blogspot.ru/2016/01/harmonic-noise-model-in-speech.html?m=1
Непонятны корни проблемы:
чувствительность оборудования, спектр звука или анализ данных в рамках контекста (омонимы, быстрая речь и.т.п.)
Добрый день, Лариса!
Корни проблемы в инвариантности модели к изменению несущей частоты. Модели на mfcc к изменению несущей частоты не инвариантны полностью, поэтому требуют больше тренировочных данных. Модели, основанные на гармоническом анализе дают одни и те же признаки для разной несущей частоты, таким образом модели можно тренировать на меньшем количестве данных.
Подобные вопросы выходят за тему данного форума, их лучше обсуждать по почте.