VoxForge
Если посмотреть вот это предстваление фонетической транскрипции
http://ru.wikipedia.org/wiki/%D0%A0%D1%83%D1%81%D1%81%D0%BA%D0%B0%D1%8F_%D1%84%D0%BE%D0%BD%D0%B5%D1%82%D0%B8%D0%BA%D0%B0
то редукция второй степени звука У происходит и в первой и во второй степенях редукции, но только после мягкий согласных
А с учётом того что звук У при распозновании с каким-либо другим похожим звуком перепутять довольно сложно, мне кажется достаточно всего двух двух звуков - под ударением (uu) и без ударения (u)
Вы согласны?
я собрал голосовую модель со своим словарём (переработанным вашим) и хотелбы что бы и вы её потестировали
http://z1.prolink.ru/sphinx.tar.bz2
очень много убил на это времени, поэтому очень хочется узнать ваше мнение
Если вас не затруднит, пожалуста переделайте лангвистическую модель до рабочего состаяние с pocketshinx и кодировкий utf8 и желательно использованием буквы "ё" - за основому можно взять прилагаемый мной словарь - в нём я практически вручную выставлял букву "ё"
Спасибо
old voice database
new phone transcription
new level recognize russian voice
connecting people and testing new vocalabilty sphinx model:
http://z1.prolink.ru/sphinx.tar.gz
http://z1.prolink.ru/sphinx/msu_ru_zero_8000Hz_v0.2.tar.gz
TOTAL Words: 79878 Correct: 74148 Errors: 7998
TOTAL Percent correct = 92.83% Error = 10.01% Accuracy = 89.99%
TOTAL Insertions: 2268 Deletions: 1540 Substitutions: 4190
all logs and configs included
TOTAL Words: 79878 Correct: 73991 Errors: 6928
TOTAL Percent correct = 92.63% Error = 8.67% Accuracy = 91.33%
TOTAL Insertions: 1041 Deletions: 1793 Substitutions: 4094
http://z1.prolink.ru/sphinx/live_decode_ru_zero.tar.gz
Создан проект посвящённый созданию русской голосовой модели для sphinx
На текущий момент создана програма создания транскрипции
Програма нормализации исходного текста
Програма для разбивки аудио-книг
git clone https://z1.prolink.ru/public/ru4sphinx
если кто-то хочет участвовать и нужен доступ на запись пишите, с удовольствием создам аккаунт
email/jabber: [email protected]
jabber/qip: [email protected]