VoxForge
Salve a tutti spero qualcuno possa aiutarmi.
Sto lavorando su un piccolo progettino per la mia tesi di laurea usando Sphinx4 (obbligatoriamente).
Ho letto un bel pò di roba su internet e su questo forum, ma tutti sorvolano una cosa (o sono io che non riesco ad afferrarla).
Come faccio praticamente e non teoricamente (perchè fin li ci sono :) ) a creare un modello acustico di 10 -15 parole secche e utilizzarlo su sphinx4.
Quale tool posso usare per crearlo? come lo do in pasto a sphinx?
Ho a mia disposizione i file wave già registrati e le trascrizioni.
Grazie
Condividere i file con Dropbox e avrai il tuo modello
Grazie.
Io sto preparando i file .wav con dentro le parole che mi serve riconoscere e per ognuna di queste sto raccogliendo circa 6/7 registrazioni di persone diverse.
Per la creazione del modello serve darti altro?
Come preferisci venga creato il file dove indico cosa contengono le registrazioni?
SI <list_of_files> NO <list_of_files> CERTO <list_of_files> etc..
oppure
<s> SI </s> (nome_file) etc..
i file audio sono qui:
https://www.dropbox.com/s/u9ri4e5c4uzpre0/file_wav_for_acoustic_model.zip
You can download a model training folder with pretrained model here:
http://alphacephei.com/test/sino.zip
The model is in the folder sino/model_parameters/sino.cd_cont_100
Overall you do not have enough data to train the acoustic model. You need way more data, at least 50 speakers, not 4 and each speaker should say same word several times.
Ok thank you for all..
I've tried the model unfortunately don't run well, but you was fantastic thank you.
I'll try to find this amount of data, i've to find it :).
I will send you this file but if is possible can you explain me how to create an acoustic model for sphinx4?
Is so difficult to realize?
Could you explain me the steps i've to follow?
This is very simple, you can just follow the documentation and modify the configuration file to load the model from the training folder. You need to modify grammar location, dictionary location, model location and update melfilterbank parameters.
You can unpack sino-data folder with all data required to sphinx4 top level folder and replace Transcriber.java and config.xml in the Transcriber demo of sphinx4.
You can find complete example with all the modifications and all required data files here:
http://alphacephei.com/test/sino-s4.zip
If you modify the transcriber demo properly the results will be:
si
si si
ok
affermativo
confermo
sbagliato
certo
va bene
corretto
ovviamente
perfetto
certamente
assolutamente si
si
no
no no
sbagliato
affermativo
non confermo
per niente
assolutamente no
non va bene
non e' corretto
rifiuto
ok
thank youuu very much for your reply, you are great :D
Now i'm trying to create my own acustic model using the guide.
I created the language model using the tutoriallm. I have the arpa model (.vocab ; .lm.DMP) and now i want to create a little acoustic model using new training database.
My question is:
How can I create my new training database?In particular i need to produce files under etc directory ( .dic ; .transcription ; .fileid ; .filler).
When you created "sino" database, did you use some particular framework or tool to produce these files? (such as phonetisaurus, sequitur-g2p).
Thanks in advance
> When you created "sino" database, did you use some particular framework or tool to produce these files? (such as phonetisaurus, sequitur-g2p).
You can use your favorite scripting language (Python, Ruby) to process text files to put them in a certain format. Also you can use your favourite text editor.
Italian dictionary doens't require phonetisaurus though you can use it to extend the dictionary. The original dictionary is from the Italian Festival project:
https://sourceforge.net/projects/it-festival
It's pretty comprehensive.
Thank you for your reply.
Now I've two problems:
The first one is:
While I try to launch this command:
/usr/local/lib/sphinxtrain/scripts/000.comp_feat/make_feats.pl -ctl etc/sino_train.fileids
I got this error:
"This step had 2 ERROR messages and 0 WARNING messages. Please check the log file for details." and my log file is empty.
Any suggestions?
The second one:
The .dic structure is differt from the festival "lex.out" file where the dictionary is placed.
How I can get a sphinx .dic file starting from festival installation ?
> /usr/local/lib/sphinxtrain/scripts/000.comp_feat/make_feats.pl -ctl etc/sino_train.ï¬Âleids
> The .dic structure is differt from the festival "lex.out" file where the dictionary is placed.
Yes
> How I can get a sphinx .dic file starting from festival installation ?
You need to convert formats, you can do it using your favorite scripting language (Python, Ruby, etc).