Hallo,
probiere gerade, die Spracherkennungssoftware "Simon listens" unter OpenSuSE 12.1 in Gang zubringen.
Bisher hab' ich's nicht geschafft, aber beschreibe trotzdem mal meine bisherigen Schritte:
1. Erstmal das rpm 'runtergeladen, von hier.
sagt, er will Qt < 4.7. Kriegt er nicht:
2. Zusätzlich wird htk und HADI-Bomp benötigt, siehe hier. Ok, registriert, bzw. per Email bestellt. Ca. eine Woche darauf gewartet. Nervig, aber geht.
3. htk kompilieren:
Fehler: Es kommt diese Meldung:
In "checkinstall" noch unter Nr. 3 eine Versionsnummer eingeben (z.B. "1"), sonst baut er das rpm nicht. Danach ging's.
So.
4.
Hmm, ziemlich leere Oberfläche. Er erwartet ein "Szenario".
Ich möchte eigentlich Briefe diktieren, also ein allgemeines, umfangreiches deutsches Vokabular. Das gibt es anscheinend so nicht.
Ein primitives Szenario zum Einstieg (mit ziemlich lächerlichen Wörtern) hier gefunden.
Runtergeladen und mit dem Menüpunkt "Manage Scenarios" installiert.
Das HADI-Bomp-Lexikon über "Vocabulary/Shadow Vocabulary/Import Dictionary" (erfolgreich) eingebunden.
Etwas Training versucht: Vocabulary/Active Vocabulary. Ein paar Wörter angeklickt und "+ Add to training".
Mikrofoneinstellungen geprüft, ok. Ton aufgenommen.
Wenn er jetzt das Sprachmodell zusammenbauen soll, kommt:
Soweit erstmal. Vielleicht weiß ja jemand anders weiter.
To be continued ...
probiere gerade, die Spracherkennungssoftware "Simon listens" unter OpenSuSE 12.1 in Gang zubringen.
Bisher hab' ich's nicht geschafft, aber beschreibe trotzdem mal meine bisherigen Schritte:
1. Erstmal das rpm 'runtergeladen, von hier.
Code:
rpm -i simon..rpm
Code:
rpm -i simon..rpm --nodeps
3. htk kompilieren:
Code:
tar -xzvf HTK-3.4.1.tar.gz
cd htk
autoconf
aclocal
./configure
make
Gemeint ist nicht das Haupt-Makefile, sondern das in "HLMTools". Ok, dort in Zeile 77 am Anfang die 8 Leerzeichen zu einem TAB geändert. Dann läuft's endlich durch.make[1]: Entering directory `/home/tg/builds/htk/src/htk/HLMTools'
Makefile:77: *** missing separator (Meinten Sie TAB anstelle von 8 Leerzeichen?). Schluss.
Code:
make
checkinstall
Code:
mv /usr/src/packages/RPMS/i386/htk-1-1.i386.rpm .
rpm -i htk-1-1.i386.rpm
4.
Code:
simon
Ich möchte eigentlich Briefe diktieren, also ein allgemeines, umfangreiches deutsches Vokabular. Das gibt es anscheinend so nicht.
Ein primitives Szenario zum Einstieg (mit ziemlich lächerlichen Wörtern) hier gefunden.
Runtergeladen und mit dem Menüpunkt "Manage Scenarios" installiert.
Das HADI-Bomp-Lexikon über "Vocabulary/Shadow Vocabulary/Import Dictionary" (erfolgreich) eingebunden.
Etwas Training versucht: Vocabulary/Active Vocabulary. Ein paar Wörter angeklickt und "+ Add to training".
Mikrofoneinstellungen geprüft, ok. Ton aufgenommen.
Wenn er jetzt das Sprachmodell zusammenbauen soll, kommt:
"/usr/bin/mkfa" und "/usr/bin/dfa_minimize" gibt es aber, und sie können (von der Konsole) auch gestartet werden. Hmm.As the server compiled the model the following error occurred:
Could not generate dfa. Please check the paths to mkfa and dfa_minimize (/usr/bin/mkfa, /usr/bin/dfa_minimize).
Soweit erstmal. Vielleicht weiß ja jemand anders weiter.
To be continued ...