А как делаются пофонемные разметки в аудио файлах.

Russian

Flat

User: tealex
Date: 9/8/2009 7:48 am

Views: 18124
Rating: 15

после того как начитывается текст.

Там же должна быть пофонемная разметка.

Автоматически делается или в ручную?

Какое разделение фонем используется? (всмысле какой набор фонем) .

Подходят ли аудио книги для этого?

Почему нет проекта не S2T а Phonetic Search ?

Много вопросов ? :)

Re:А как делаются пофонемные разметки в аудио файлах.

User: nsh
Date: 9/8/2009 9:53 am

Views: 260
Rating: 13

> после того как начитывается текст.

Никак не делаются

> Там же должна быть пофонемная разметка.

Не должна

> Автоматически делается или вручную?

Если такая разметка нужна, её можно сделать автоматически.

> Какое разделение фонем используется? (всмысле какой набор фонем) .

Используемый набор аллофонов (это не фонемы) находится в файле в etc/msu_ru_nsh.phone.

> Подходят ли аудио книги для этого?

Для чего этого?

> Почему нет проекта не S2T а Phonetic Search ?

Почему люди не летают?

User: tealex
Date: 9/8/2009 2:00 pm

Views: 239
Rating: 13

> Автоматически делается или вручную?

Если такая разметка нужна, её можно сделать автоматически.

================

разве разметка не нужна для обучения ??

> Какое разделение фонем используется? (всмысле какой набор фонем) .
Используемый набор аллофонов (это не фонемы) находится в файле в etc/msu_ru_nsh.phone.

====

круто

как имея текст получить последовательность аллофонов ?

> Подходят ли аудио книги для этого?

Для чего этого?

=======

у аудио книги есть текст + аудио

подходят ли они как моделии обучения? почему ?

> Почему нет проекта не S2T а Phonetic Search ?

Почему люди не летают?

====

те его нет почему ?

потому что никто не делает .... или потому что большая разница между Phonetic Search и S2T

мне казалось там разница не очень большая ....

Re:А как делаются пофонемные разметки в аудио файлах.

User: nsh
Date: 9/8/2009 3:06 pm

Views: 642
Rating: 15

> разве разметка не нужна для обучения?

Разметка на аллофоны не нужна, только транскрипция уровня слов.

> Как имея текст получить последовательность аллофонов?

Поставить аллофоны для каждого слова из словаря или использовать специализированную программу.

> подходят ли они как модели обучения? почему?

Для обучения модели аудиокниги используются. В данной

базе они больше 70% составляют.

> потому что никто не делает .... или потому что большая разница между Phonetic Search и S2T. мне казалось там разница не очень большая ....

Разницы между распознаванием и поиском нет. Тем не менее, доступного ПО по индексации и поиску нет. На вопрос "почему" я затрудняюсь ответить.

User: tealex
Date: 9/8/2009 3:35 pm

Views: 249
Rating: 15

> разве разметка не нужна для обучения?

Разметка на аллофоны не нужна, только транскрипция уровня слов.

====

где можно посмотреть какие алгоритмы используются для получения разметки уровня слов ? Или нужно копаться в исходниках программ? Каких программ ?

> Как имея текст получить последовательность аллофонов?

Поставить аллофоны для каждого слова из словаря или использовать специализированную программу.

===========

где можно помотреть алгоритмы ? Или нужно копаться в исходниках программ? Каких программ ? Для русского языка.

> подходят ли они как модели обучения? почему?
Для обучения модели аудиокниги используются. В данной

базе они больше 70% составляют.

========

Разметка уровня слов была сделана автоматически?

=====================

А вообще есть ли надобность в аудиозаписях размеченным по аллофонам/фонемам для s2t ? для Phonetic Search как я представляю без них никак. Вообще я такие записи кроме загадочной RuSpeech не знаю и тем более лежащие в свободном доступе.

Re: Re:А как делаются пофонемные разметки в аудио файлах.

User: nsh
Date: 9/8/2009 4:49 pm

Views: 260
Rating: 15

> где можно посмотреть какие алгоритмы используются для получения разметки уровня слов ? Или нужно копаться в исходниках программ? Каких программ ?

Хм, алгоритмы для получения разметки уровня слов это алгоритмы распознавания речи. Посмотреть информацию о них можно в книжке. Spoken Language Processing например:

http://dsp-book.narod.ru/SLP1.djvu

http://dsp-book.narod.ru/SLP2.djvu

> Как имея текст получить последовательность аллофонов?
Поставить аллофоны для каждого слова из словаря или использовать специализированную программу.

Алгоритмы преобразования текста в аллофоны описаны в литературе. Например, вот такая статься описывает детали http://www.philol.msu.ru/~otipl/SpeechGroup/publications/2001/stat_kaz.doc

Реализацию этих алгоритмов можно найти в синтезаторе русской речи.

> Разметка уровня слов была сделана автоматически?

Для тренировки базы разметка делается вручную.

> А вообще есть ли надобность в аудиозаписях размеченным по аллофонам/фонемам для s2t? для Phonetic Search как я представляю без них никак. Вообще я такие записи кроме загадочной RuSpeech не знаю и тем более лежащие в свободном доступе.

Большой надобности нет.

Re: Re:ÃÂÃÂ ÃÂÃÂºÃÂÃÂ°ÃÂÃÂº ÃÂÃÂ´ÃÂÃÂµÃÂÃÂ»ÃÂÃÂ°ÃÂÃÂÃÂÃÂÃÂÃÂÃÂÃÂ ÃÂÃÂ¿ÃÂÃÂ¾ÃÂÃÂÃ

User: tealex
Date: 9/8/2009 5:28 pm

Views: 239
Rating: 18

Реализацию этих алгоритмов можно найти в синтезаторе русской речи.

========

Спасибо за doc.

Можно название или сылку на синтезатор.

> Разметка уровня слов была сделана автоматически?

Для тренировки базы разметка делается вручную.

=============

МММ. Какая то путаница.

Я правильно понимаю что для тренировки базы , необходима разметка по словам (начало-конец) . И это операция сейчас не делается автоматически.Те это ручная операция и если она будет автоматизированна то распознование может быть улучшенно, за счёт большей базы?

Это верно как для русского так и для английского языков ?

Тогда я не понял про то что вы говорили про автоматическую разметку. И почему она не годится для тренировки.

С какой точностью нужна разметка по словам ? сотые секунд , тысячные?

Нужны ли ещё базы для улучшения качества ?

Нужны ли допустим размеченные аудио книги. Или для улучшения базы нужны другие источники аудио данных(телевидение , радио ....).

Те те записи которые люди записывают через зайт (java аплет ) он потом вручную размечается ?

Re:А как делаются пофонемные разметки в аудио файлах.

User: nsh
Date: 9/9/2009 11:11 am

Views: 3374
Rating: 15

> Можно название или сылку на синтезатор.

Festival/msu_ru_nsh_clunits

http://festlang.berlios.de/docu/doku.php?id=russianru

> Я правильно понимаю что для тренировки базы , необходима разметка по словам (начало-конец) .

Нет. То, как выглядит база можно посмотреть, скачав её на этом сайте. База состоит из большого числа коротких записей (5-10с) и текста к каждой из записей.

> Нужны ли ещё базы для улучшения качества ?

Единственная цель этого ресурса - собрать дополнительные базы для улучшения качества.

User: Visitor
Date: 11/15/2014 2:21 am

Views: 4221
Rating: 7

> Ð³Ð´Ðµ Ð¼Ð¾Ð¶Ð½Ð¾ Ð¿Ð¾ÑÐ¼Ð¾ÑÑÐµÑÑ ÐºÐ°ÐºÐ¸Ðµ Ð°Ð»Ð³Ð¾ÑÐ¸ÑÐ¼Ñ Ð¸ÑÐ¿Ð¾Ð»ÑÐ·ÑÑÑÑÑ Ð´Ð»Ñ Ð¿Ð¾Ð»ÑÑÐµÐ½Ð¸Ñ ÑÐ°Ð·Ð¼ÐµÑÐºÐ¸ ÑÑÐ¾Ð²Ð½Ñ ÑÐ»Ð¾Ð² ? ÐÐ»Ð¸ Ð½ÑÐ¶Ð½Ð¾ ÐºÐ¾Ð¿Ð°ÑÑÑÑ Ð² Ð¸ÑÑÐ¾Ð´Ð½Ð¸ÐºÐ°Ñ Ð¿ÑÐ¾Ð³ÑÐ°Ð¼Ð¼? ÐÐ°ÐºÐ¸Ñ Ð¿ÑÐ¾Ð³ÑÐ°Ð¼Ð¼ ?

Ð¥Ð¼, Ð°Ð»Ð³Ð¾ÑÐ¸ÑÐ¼Ñ Ð´Ð»Ñ Ð¿Ð¾Ð»ÑÑÐµÐ½Ð¸Ñ ÑÐ°Ð·Ð¼ÐµÑÐºÐ¸ ÑÑÐ¾Ð²Ð½Ñ ÑÐ»Ð¾Ð² ÑÑÐ¾ Ð°Ð»Ð³Ð¾ÑÐ¸ÑÐ¼Ñ ÑÐ°ÑÐ¿Ð¾Ð·Ð½Ð°Ð²Ð°Ð½Ð¸Ñ ÑÐµÑÐ¸. ÐÐ¾ÑÐ¼Ð¾ÑÑÐµÑÑ Ð¸Ð½ÑÐ¾ÑÐ¼Ð°ÑÐ¸Ñ Ð¾ Ð½Ð¸Ñ Ð¼Ð¾Ð¶Ð½Ð¾ Ð² ÐºÐ½Ð¸Ð¶ÐºÐµ. Spoken Language Processing Ð½Ð°Ð¿ÑÐ¸Ð¼ÐµÑ:

http://dsp-book.narod.ru/SLP1.djvu

http://dsp-book.narod.ru/SLP2.djvu

> ÐÐ°Ðº Ð¸Ð¼ÐµÑ ÑÐµÐºÑÑ Ð¿Ð¾Ð»ÑÑÐ¸ÑÑ Ð¿Ð¾ÑÐ»ÐµÐ´Ð¾Ð²Ð°ÑÐµÐ»ÑÐ½Ð¾ÑÑÑ Ð°Ð»Ð»Ð¾ÑÐ¾Ð½Ð¾Ð²?
ÐÐ¾ÑÑÐ°Ð²Ð¸ÑÑ Ð°Ð»Ð»Ð¾ÑÐ¾Ð½Ñ Ð´Ð»Ñ ÐºÐ°Ð¶Ð´Ð¾Ð³Ð¾ ÑÐ»Ð¾Ð²Ð° Ð¸Ð· ÑÐ»Ð¾Ð²Ð°ÑÑ Ð¸Ð»Ð¸ Ð¸ÑÐ¿Ð¾Ð»ÑÐ·Ð¾Ð²Ð°ÑÑ ÑÐ¿ÐµÑÐ¸Ð°Ð»Ð¸Ð·Ð¸ÑÐ¾Ð²Ð°Ð½Ð½ÑÑ Ð¿ÑÐ¾Ð³ÑÐ°Ð¼Ð¼Ñ.

ÐÐ»Ð³Ð¾ÑÐ¸ÑÐ¼Ñ Ð¿ÑÐµÐ¾Ð±ÑÐ°Ð·Ð¾Ð²Ð°Ð½Ð¸Ñ ÑÐµÐºÑÑÐ° Ð² Ð°Ð»Ð»Ð¾ÑÐ¾Ð½Ñ Ð¾Ð¿Ð¸ÑÐ°Ð½Ñ Ð² Ð»Ð¸ÑÐµÑÐ°ÑÑÑÐµ. ÐÐ°Ð¿ÑÐ¸Ð¼ÐµÑ, Ð²Ð¾Ñ ÑÐ°ÐºÐ°Ñ ÑÑÐ°ÑÑÑÑ Ð¾Ð¿Ð¸ÑÑÐ²Ð°ÐµÑ Ð´ÐµÑÐ°Ð»Ð¸ http://www.philol.msu.ru/~otipl/SpeechGroup/publications/2001/stat_kaz.doc

Ð ÐµÐ°Ð»Ð¸Ð·Ð°ÑÐ¸Ñ ÑÑÐ¸Ñ Ð°Ð»Ð³Ð¾ÑÐ¸ÑÐ¼Ð¾Ð² Ð¼Ð¾Ð¶Ð½Ð¾ Ð½Ð°Ð¹ÑÐ¸ Ð² ÑÐ¸Ð½ÑÐµÐ·Ð°ÑÐ¾ÑÐµ ÑÑÑÑÐºÐ¾Ð¹ ÑÐµÑÐ¸.

> Ð Ð°Ð·Ð¼ÐµÑÐºÐ° ÑÑÐ¾Ð²Ð½Ñ ÑÐ»Ð¾Ð² Ð±ÑÐ»Ð° ÑÐ´ÐµÐ»Ð°Ð½Ð° Ð°Ð²ÑÐ¾Ð¼Ð°ÑÐ¸ÑÐµÑÐºÐ¸?

ÐÐ»Ñ ÑÑÐµÐ½Ð¸ÑÐ¾Ð²ÐºÐ¸ Ð±Ð°Ð·Ñ ÑÐ°Ð·Ð¼ÐµÑÐºÐ° Ð´ÐµÐ»Ð°ÐµÑÑÑ Ð²ÑÑÑÐ½ÑÑ.

> Ð Ð²Ð¾Ð¾Ð±ÑÐµ ÐµÑÑÑ Ð»Ð¸ Ð½Ð°Ð´Ð¾Ð±Ð½Ð¾ÑÑÑ Ð² Ð°ÑÐ´Ð¸Ð¾Ð·Ð°Ð¿Ð¸ÑÑÑ ÑÐ°Ð·Ð¼ÐµÑÐµÐ½Ð½ÑÐ¼ Ð¿Ð¾ Ð°Ð»Ð»Ð¾ÑÐ¾Ð½Ð°Ð¼/ÑÐ¾Ð½ÐµÐ¼Ð°Ð¼ Ð´Ð»Ñ s2t? Ð´Ð»Ñ Phonetic Search ÐºÐ°Ðº Ñ Ð¿ÑÐµÐ´ÑÑÐ°Ð²Ð»ÑÑ Ð±ÐµÐ· Ð½Ð¸Ñ Ð½Ð¸ÐºÐ°Ðº. ÐÐ¾Ð¾Ð±ÑÐµ Ñ ÑÐ°ÐºÐ¸Ðµ Ð·Ð°Ð¿Ð¸ÑÐ¸ ÐºÑÐ¾Ð¼Ðµ Ð·Ð°Ð³Ð°Ð´Ð¾ÑÐ½Ð¾Ð¹ RuSpeech Ð½Ðµ Ð·Ð½Ð°Ñ Ð¸ ÑÐµÐ¼ Ð±Ð¾Ð»ÐµÐµ Ð»ÐµÐ¶Ð°ÑÐ¸Ðµ Ð² ÑÐ²Ð¾Ð±Ð¾Ð´Ð½Ð¾Ð¼ Ð´Ð¾ÑÑÑÐ¿Ðµ.

ÐÐ¾Ð»ÑÑÐ¾Ð¹ Ð½Ð°Ð´Ð¾Ð±Ð½Ð¾ÑÑÐ¸ Ð½ÐµÑ.

Previous • Next •


Username	Password