VoxForge
Возможно ли такое? Тоесть у меня задача такая: Есть wav файл, который записывает любой человек, без какой бы то ни было подготовки, просто берет микрофон и говорит некоторый набор предложений
Мне нужно этот файл перевести в текст.
С чего мне начать? Пробовал сделать по мануалу, но там много нюансов типа .voca и .grammar файлов я не совсем понял как с ними быть, у меня нет некой последовательности команд, это будет просто набор слов.
Еще и мой английский не позволяет уверенно находить нужные мне моменты ... подскажите откуда стоит отталкиваться
> Возможно ли такое?
Нет, обучение всегда присутствует
> Мне нужно этот файл перевести в текст
Это сложная задача требующая специальной подготовки
> С чего мне начать?
С чтения литературы
> Пробовал сделать по мануалу, но там много нюансов типа .voca и .grammar файлов я не совсем понял как с ними быть, у меня нет некой последовательности команд, это будет просто набор слов.
При распознавании речи с большим словарём вместо фиксированных грамматик применяются статистические, например, триграммные модели языка. Они строятся по похожим текстам
> Еще и мой английский не позволяет уверенно находить нужные мне моменты
Нужно подтянуть английский. На русском правильной литературы нет. Можете вот это только почитать:
http://aprodeus.narod.ru/mmedia.htm