Fräulein Mac, zum Diktat bitte …

Dies ist der Versuch ein Review zu diktieren. Ich habe dazu von einem Kunden die Software iListen von ASH zur Verfügung gestellt bekommen. iListen wird zusammen mit einem Headset von Parrot ausgeliefert und soll out-of-the-box den Benutzer befähigen dem Macintosh Texte für Briefe, Faxe, eMails oder Memos zu diktieren.

Nach erfolgter Installation wird das Programm auf seinen „neuen Herren“ trainiert. Dazu werden zunächst die Sprechgeschwindigkeit und die Sprachlautstärke des Benutzers sowie die Umgebungsgeräusche ermittelt und das Mikrophon kalibiert. Danach startet eine Trainingssitzung in der das Programm lernt wie der Benutzer Wörter artikuliert. Pro Benutzer kann so eine individuelle Stimmreferenz erzeugt werden, anhand derer iListen die Texterkennung durchführt.

Soviel zur Theorie. In der Praxis bedarf es einiger Trainingssitzungen, bis eine halbwegs ordentliche Trefferrate zustande kommt. Nachfolgend der bisherige Text mal als Kostprobe:

dieses der Versuch eine Religion zu diktieren. Ich habe dazu von einem Kunden die Software iListen, von Preis hat zur Verfügung gestellt bekommen. IListen wird zusammen mit einem Hetze von einer ausgeliefert und soll baut auf der Box den Benutzer befähigen den Macintosh Texte für Briefe, wachse, E-mails oder Memos zu diktieren.

Nach erfolgter Installation wird das Programm auf seinen „neuen Herrn“ trainiert. Das zu werden zunächst die spricht Geschwindigkeit und die Sprache Lautstärke des Benutzers sowie die Umgebung Bräuche ermittelt und das Mikrofon karikiert. Danach startet eine Trainings Sitzung, in der das Programm lernt wie der Benutzer Wörter artikuliert. Pol Benutzer kann so eine individuelle Stimme Referenz erzeugt werden, anhand derer ein ließen die Texte Kennung durchführt.

Soviel zur Theorie. In der Praxis bedarf es einige Trainings Sitzungen, bis eine halbwegs ordentliche der Verrat zustande kommt. Nachfolgend den bisherigen Text mal als Kostprobe:

Dieses Diktat entstand nach dem ersten Basistraining, welches lediglich ein paar Dutzend Sätze umfasst. Auch nach einer weiterem Trainingsdurchlauf ist das Ergebnis nicht so viel besser geworden:

dies ist der Versuch eine Million zu diktieren. Ich habe dazu wovon eine Kunden die Software iListen von ATS Haar zur Verfügung gestellt bekommen. IListen wird zusammen mit einem hätte Zeit von Bayreuth ausgeliefert und soll auch auf der Box den Benutzer bisher in den Macintosh Texte für Briefe, wachse, E-mails oder Memos zu diktieren.

Nach Erfolg der Inflation wird das Programm auf seinen „neuen Herren“ trainiert. Dazu werden zunächst die sprich Geschwindigkeit und die Sprache Lautstärke des Benutzers sowie die Umgebung gehorche vermittelt und das Mikrofon Kali beschert. Danach startet eine Trainings sie zum in der das Programm der Hand wieder Benutzer noch der artikuliert. Bauer Benutzer kann so eine individuelle Stimme Referenz erzeugt werden, anhand der war ein müssen die Texte Kennung durchführt.

Soviel zur Theorie. In der Praxis bedarf es einige Trainings Sitzungen, bis eine halbwegs ordentliche Treffer Rate zustande kommt. Nachfolgend der bisherige Text mal als Kostprobe:

Etwas ungewohnt auch: jedes Satzzeichen und jeder Absatz muß mitdiktiert werden. So als wäre die Sekretärin Legasthenikerin . Weiterhin unzureichend: iListen setzt Worte nach den alten Rechtschreibregeln.

Dazu kommt, das sich iListen recht zickig gibt, wenn es darum geht andere als das mitverkaufte Headset anzusteuern. Ein mit diversen Windows-Spracherkennungsprogrammen arbeitendes Philips Handmikrophon das unter OS X erkannt wird und das mit Quicktime hervorragend zusammenarbeitete, wird zwar in der Device-Auswahl von iListen angeboten, aber schon in der Kalibrierung wieder abgeblockt. Einen vernünftigen Grund gibt es dafür nicht, so daß sich der Verdacht aufdrängt, das über eine künstliche Beschränkung innerhalb des Programms „MacSpeech-Zertifizierte Hardware“ verkaufsgefördert werden soll. Grundsätzlich nicht unterstützt sind alle Arten von Bluetooth-Headsets, da es hier übertragungsbedingt zu Verzögerungen und Verzerrungen durch die Datenkompression kommen kann, mit denen die Spracherkennung nicht zurecht kommt. Schade, aber wenigstens nachvollziehbar. Tröstlich immerhin, das das Headset wenigstens auch z.B. für iChat (und sicher auch für andere VoIP-Lösungen) verwendet werden kann.

Weiterhin werden nur lokale Benutzer unterstützt, die zudem über Administrationsrechte verfügen müssen. Dies widerspricht zum einen elementaren Sicherheitsvorkehrungen unter OS X; zum anderen sind Benutzer mit netzwerkbasierten Homeverzeichnissen unter OS X Server damit vollständig von der Verwendung ausgeschlossen.

Leider ist iListen derzeit – wie auch Route66 – der Einäugige unter den Blinden. Sprich: es gibt kein anderes, natives Mac OS X Programm als Alternative. Erste Versuche mit vergleichbarer Windows-Software unter Parallels sind zur Zeit in Arbeit, versprechen aber keine Besserung der Situation, da hier zwar die Mikrophone auf Betriebssystemebene prima durchgereicht werden (sprich: mit Windows selbst können qualitativ gute Aufnahmen gemacht werden), die Spracherkennungsprogramme aber offensichtlich eigene Input-Ressourcen verwenden, die die Aufnahme nur mit einem deutlichen und störenden Brummen ermöglichen.

Fazit: Nach reichlich Training sollte man immer noch auf eine Fehlerquote von um die 2 % gefasst sein. Das klingt zunächst nach nicht viel, bezogen auf einen einseitigen A4-Geschäftsbrief verbleiben aber so immer noch 2 bis 3 Worte die in einer Korrekturlesung identifiziert und i.d.R. manuell nachbearbeitet werden müssen. In dieser Fehlerquote nicht mitgezählt werden können sicherlich sinnentstellende Umsetzungen, die zwar korrekt phonetisch erkannt wurden, aber z.B. aufgrund von Groß-/Kleinschreibung oder Zusammen-/Getrenntsetzung fehlerhaft sind.

Als sehr viel schwerwiegender noch empfinde ich, dass die Implementierung so ziemlich an OS X vorbei geht. Benutzerprofile liegen im systemweiten Library-Ordner, die Zusammenarbeit mit OS X Server schlägt vollkommen fehl und der Betrieb der Software verlangt nach administrativen Rechten. Eine Lieblosigkeit wie sie sonst nur bei Windowssoftware bekannt ist. Für meinen Teil verläßt das Teil mit Ende dieses Tests wieder meine Platte und wird mein Konto sicher nicht belasten.

3 Kommentare zu „Fräulein Mac, zum Diktat bitte …“

  1. Vielen Dank für diesen Hinweis, den man so in einer Zeitschrift natürlich nicht findet, geschweige denn auf der Website des deutschen Distributors ASH. Ist Dragon Naturally Speaking über den Umweg Parallels 3 inzwischen von Dir getestet worden?

  2. Ich bin es noch einmal, und ich habe selbst recherchiert.

    Also: Dragon Naturally Speakng läuft ohne erkennbare Einschränklungen unter Windows (XP) und Parallels 3.0 – und iListen wurde eingestellt. Schöner, ungarer Unrat, den wir da kaufen sollten.

  3. Es kommt noch besser:

    »Jetzt hat MacSpeech seine Lösung iListen zwar eingestellt, der Software-Hersteller ersetzt sie aber durch die neue Software Dictate, die er auf der Macworld Expo vorgestellt hat. Sie basiert auf der „NaturallySpeaking“-Technik von Dragon, die auf Windows-PCs verbreitet ist und die MacSpeech lizensiert hat – sie soll am Mac genau so gut funktionieren wie unter Windows, verspricht der Hersteller.«

    via MacNews

Kommentarfunktion geschlossen.

Nach oben scrollen