Russian

Nested
KWS ложные срабатывания
User: Winchester
Date: 8/19/2014 7:21 am
Views: 13665
Rating: 7

Здравствуйте. Пытаюсь реализовать алгоритм поиска ключевых слов на основании фонем. Точность распознавания фонем составляет порядка 60% (обучение акустических моделей производилось средствами HTK). Слова, требуемые для поиска, вводятся с клавиатуры и конвертируются в набор фонем. Основная проблема состоит в большом количестве ложных срабатываний. Возможно каким-либо образом решить эту проблему, не прибегая к лингвистическим моделям и достаточно ли такое качество распознавания? Если есть литература по этому вопросу, буду рад)

Спасибо!

Re: KWS ложные срабатывания
User: nsh
Date: 8/19/2014 10:38 am
Views: 3971
Rating: 11

60% точность - в порядке вещей, если постраться, можно довести до 70%. Лучшие алгоритмы вроде DNN дают 80%.

 

Способов улучшить качество поиска много, зависит от текущей реализации. Простейший - увеличить длину слова для поиска. Более сложные используют матрицы спутывания фонем и меры уверенности, не думаю, что у Вас это реализовано.

 

Прочитать об алгоритме можно здесь

http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.261.626

О последних достижениях можно прочитать тут:

http://www3.ntu.edu.sg/home2009/dova0001/papers/2013_INTERSPEECH_A%20Study%20on%20LVCSR%20and%20Keyword%20Search%20for%20Tagalog.pdf

 

PreviousNext