VoxForge
В процессе поиска программ управления голосом я наткнулся на систему распознавания речи Simon. Программа перспективная, так как систем распознавания русского языка я в ходе своего не слишком долгого, но тщательного поиска не нашел. Она может работать с любым языком, только нужна языковая модель и словарь с фонемами. Я пытался использовать таковые с этого сайта, но тут только какие-то странные архивы с расширением gtar с файлом без расширения внутри. Программа их не прожевывает и выплевывает. Я наткнулся на языковую модель по этой ссылке: http://spirit.blau.in/simon/speech-model/, а также на два словаря по этим ссылкам: http://spirit.blau.in/simon/2010/05/24/ralfs-russian-dictionary-0-1-1/ и http://spirit.blau.in/simon/2009/11/14/import-140-000-russian-words/.
Только беда в том, что языковая модель и оба словаря используют три разных системы фонем (вроде бы). Отчего у программы съезжает крыша, и она засыпает меня сообщениями об ошибках. Прошу помочь мне с подготовкой данных или с этого сайта, или приведения в надлежащий вид творений господина Ральфа. Если вы мне поможете то у всего русскоязычного сообщества появится достойная программа распознавания речи, работающая под Window's, которая сделает чуточку счастливее инвалидов, лентяев и гиков.
Техническая информация:
Сайты программы:
http://simon-listens.blogspot.ru/
http://simon-listens.org/index.php?id=398&L=1
Вики:
Hidden Markov Model Toolkit (HTK) (необходим для установки программы):
Какая то ссылка из гугля:
http://www.opennet.ru/opennews/art.shtml?num=35731
Программа использует HTK, Julius и вроде CMU SPHINX, что бы это все не значило. Кушает словари HADIFIX, HTK Lexicon, PLS lexicon, Sphinx lexicon, Julius lexicon. Поглощает языковые модели с расширением sbm (это вроде ее собственный формат).
PS: В случае удачного решения проблемы с работой программы дарую спасибо с царского плеча и тыщу рублей злотых.
Я загрузил в программу языковую модель отсюда:
http://www.dev.voxforge.org/projects/Russian/browser/Trunk/AcousticModels/model_parameters/msu_ru_nsh.cd_cont_1000_8gau_16000
Словарь отсюда:
http://www.dev.voxforge.org/projects/Russian/browser/Trunk/AcousticModels/etc/msu_ru_nsh.dic
Но она по прежнему отказывается работать. Пойду тормошить форум программы.
Программу запустил, она при определенном обучении замечательно понимает русский язык. Нужно только русские слова записывать в транслите и задавать грамматику для всех слов в словаре.
Теперь возникла другая просьба. Не могла-бы какая-нибудь добрая душа конвертировать из Sphinx в HTK формат модель с этого сайта. Программа с ним работает быстрее. Хотелось бы протестировать - может модель в этом формате становится и более обучаемой.