Spanish

Flat
Re: New training phrases for spanish
User: buhochileno
Date: 11/18/2008 12:56 pm
Views: 61
Rating: 1

Mas noticias...

Acabo de terminar el proceso semi automatico que implementaste y funciona de mil maravillas!!!, gracias ahorra muchisimo tiempo y es muy emocionante ver palabras correctamente reconocidas, pero tengo algunas preguntas:

- como saber cuales de todas las palabras grabadas en las frases son reconocidad?, solo probando?

- cual es el estado actual de tus pruebas?, veo que al decir algunas palabras julius se queja sobre triphones, asumo que todavia no se hace el proceso para los triphonos?

- voy a ver de hacer el script3 para crear el modelo para "sp" para aportarte en algo, o ya lo tienes hecho?

- como podemos vanzar en un proceso que automatice desde la construccion de un diccionario "deseado", es decir "esto es lo que quiero que se reconozca", pasando por grabar las frases y cantidad adecuadas para reconocer esas palabras?

Respecto a mi sesion de voz he intentado subirla 2 veces y ambas han fallado, voy a intentar un poco mas tarde desde casa, de todas formas una vez arriba te agradeceria me dijieras si es de la calidad esperada..

Respecto al gnome-voice-control, para que reconozca español, revisando mis archivos solo puedo decirte que Nickolay de CMUSphinx no me informo mucho de como lo hacia, solo me pidio un diccionario en español con los correspondientes phonemas, pero solo para las palabras soportadas por gnome-voice-control (tipo "abrir editor de texto", etc..). Para eso me paso el link del Dr.Nolazco en el sitio de CMUSphinx:

http://www.speech.cs.cmu.edu/sphinx/models/hub4spanish_itesm/

que me parece ya revisaste.Entonces me base en ese diccionario, luego me pidio enviarselo y al parecer el genero el modelo, seguramente tiene herramientas automaticas como las tuyas), luego de esto me paso los archivos que tengo en la carpeta voxforge-es que te adjunto y que se debe copiar en la ruta:

/usr/share/pocketsphinx/model

(por supuesto se debe tener sphinx y pocketsphinx instalados con las ultimas fuentes desde el repositorio)

Avisame si quieres probar el gnome-voice-control en español o si tienes problemas para compilarlo (suele ser un desafio dependiendo de que tan rotas tienen las fuentes en el repo)...

Seria bueno integrar tu trabajo y el de gnome-voice-control, puesto que este ultimo ya hace el trabajo de comunicarse con la capa de accesibilidad de gnome, por lo tanto una persona podria entrenar su propia voz (para mas presicion a falta de un modelo acustico general de buena calidad), con el grupo de palabras/comando que desee controlar y luego integrar eso a gnome-voice-control para la accion final (mover raton arriba,etc..)

Saludos y espero poder colaborar mas en lo futuro.

Mauricio

 

 

voxforge-es.tar.gz voxforge-es.tar.gz
Re: New training phrases for spanish
User: ubanov
Date: 11/18/2008 5:15 pm
Views: 107
Rating: 1

Este es muy largo para contestarlo en inglés... vamos a tomar el camino fácil y utilizar nuestra lengua :-P

I have the script changed in order to make all the process automatically. I have attached you the new script (see the auto/script_auto script).

The julian configuration, now is a bit more complex (the grammar).

If you want to recognize more words, first of all you should try to  change the files sample.voca and sample.grammar (then compile and run julian).

If you get that some triphones are missing. Then prepare new phrases containing the words you want to recognize. Record the phrases and change the files auto/prompts, auto/codetrain.scp, auto/train.scp, and lexicon/voxforge_lexicon_spanish if some word is missing.

Then run script_auto again.

Now I have added all the phrases that appear in voxforge (spanish) to the training process. Tomorrow I will add the phrases from mauricio.

Me he cansado del inglés :-) los triphones si son creados, pero hay miles y miles de ellos... (un triphone es la unión de tres fonemas, imagina la cantidad de ellos que pueden aparecer). Yo creo que hace falta muchas horas de conversación para meterle al training, y también haría falta el meter más frases conteniendo más triphones. Por último me faltaría el training de los ruidos... lo más dificil de todo es el llegar a conseguir unas 140horas de grabación para poder empezar a hacer un reconocimiento multiusuario decente.

Yo herramientas tengo 4 mierdaprogramas que he desarrollado yo para ayudarme....

Yo por ahora estoy haciendo el reconocimiento para julius (la única comparativa que he leído dice que tiene mayor ratio de acierto a la hora de reconocer y puestos a elegir, pues elegí julius...)

Si me interesaría probar el gnome-voice-control en castellano. Qué modelo acústico ha empleado? el del dr.nolazco?

Otro día más que me voy a dormir :-P

Un saludo.

 

 

train_spanish_3.01.tgz train_spanish_3.01.tgz
Re: New training phrases for spanish
User: buhochileno
Date: 11/18/2008 5:21 pm
Views: 51
Rating: 1

sip, me parece que el modelo empleado es el del dr.nolazco...espero poder probar el metodo que me indicas con un diccionario reducido de palabras tipo "command and control" para tratar de manejar el pc..

 

Saludos

Mauricio

 

Re: New training phrases for spanish
User: ubanov
Date: 11/18/2008 5:37 pm
Views: 158
Rating: 1

Yo estoy haciendo un robot y llegué al tema de reconocimiento desde ahí. Si te fijas en la gramática que tengo implementada, va orientado a ordenes para un robot...

Haz la lista de frases que querrías reconocer y buscamos como integrarlas o si se pueden integrar con lo que hay.

 

Re: New training phrases for spanish
User: buhochileno
Date: 11/18/2008 6:31 pm
Views: 49
Rating: 1

Hola de nuevo...

ufff creo tenemos que hablar mas de lo que estamos haciendo, soy el encargado del proyecto monobotics, mira en:

http://monobotics.sourceforge.net

mi idea final es poder integrar tambien algun reconocimiento de voz basico para manejo de robots y entornos de automatizacion en el proyecto que tengo (un estudio/framework de robotica y automatizacion)..

cual de todos los archivos que tienes se refiere especificamente a tu gramatica y los comandos para robots a los que te refieres?

en mi caso me gustaria ademas de eso agregar algunos basicos para manejo de mouse/teclado y manipulacion de escenarios de edicion 3D como: "insertar caja"...

 

Mauricio

Re: New training phrases for spanish
User: buhochileno
Date: 11/23/2008 2:46 pm
Views: 105
Rating: 1

Hi ubanov:

I remove all the "chick" sound in the phrases (I remove it manually I'm trying to make a script to trim first and last second on each file) and I'm trying to upload the file, hopefully this time is going to work..

I attach a "wish list" of word that I would like to be able to recognize, is a long list and of course I want to help in anithing related, like the necesary phrases, etc..so just let me know what program from yuo and in with order can I use to make a gramar, determine what phonemas are missing, etc...

Cheers,

By the way, let me know if you want some help with the robot, I have lot of experience building Pc based linux robots..I add some media content in the http://monobotics.sourceforge.net site to see what we do about it..

P.S: Ken: do I need some special permision to be able to add a attach of about 80mb on the http://www.voxforge.org/home/submitspeech/linux/step-3/upload  ?

bye..

 

spanish.dict spanish.dict
Re: New training phrases for spanish
User: buhochileno
Date: 11/23/2008 3:08 pm
Views: 74
Rating: 1

Ubanov:

sorry for the troubles but with the new auto_script I have severall problems related to folders that are not exist in my case like:

 ../train/mfcc/ubanov2/01.mfc

how can I set that correctly?...

also, do you change something int the "record_promp" program?, now it seems that have problems moving forward on prases (with "enter") ...

Cheers,

Mauricio

 

Re: New training phrases for spanish
User: ubanov
Date: 11/25/2008 4:59 pm
Views: 273
Rating: 1

Hi mauricio,

I have not changed anything in the recording step... and I have tried in my computer and all works ok?!?!?

With the training I have been working in adding all the spanish availabre phrases in the training process. Then I have updated the dict file, and added in the files *.scp all the files. I make one mistake, and forgotten to put the correct scp files in the file that uploaded... but it's easy to correct: change dir to auto dir, and execute cp yourown/* .

At the end have you uploaded your phrases?

I need help in order to upload all my spanish speech recognition to subversion repository O:-) Ken could you help me (I send you an email last week).

Thanks in advance.

Re: New training phrases for spanish
User: buhochileno
Date: 11/25/2008 6:15 pm
Views: 144
Rating: 6

Hi Ivan:

Yeap I upload my session (without the "chics") to the voxforge server at http://www.voxforge.org/home/submit/audiobooks/ftp-submissions just now...and I let know to Ken to put a link somewhere...

Next days I going to upload more session from me and other guys here at my Uni...

About the auto script...weird as I tell you is claiming about "ubanov" folders averywhare, so I'm using 3.00 version still...

I'm confuse about how to use your "mierdaprogramas" and the step in voxforge tutorial about how to create the grammar, find phonemes, etc...as I tell you I want to generate a more big grammar based on the words that I attach you a couple of message ago..

 

Cheers,

Mauricio

 

Re: New training phrases for spanish
User: kmaclean
Date: 11/25/2008 7:30 pm
Views: 98
Rating: 6

Hi Mauricio,

Here is the link to your submission: buhochileno_ES_01

I noticed that you recorded you submission in stereo format.  This actually doubles the size of your files (even if nothing is recorded in the second channel).  I would recommend that you record any further submission in  mono audio format, since that is what we use to create acoustic models.

thanks,

Ken

PreviousNext