Computerhilfen Teil 2: Texterkennungssoftware

Vor einigen Tagen habe ich an dieser Stelle darüber berichtet, was die sogenannte Text-to-Speech Software alles kann. Programme dieser Art können einem jeden beliebigen Text vorlesen. Das klingt dann zwar nicht immer wirklich menschlich, doch inzwischen durchaus der normalen Sprache ähnlich. Doch auch für das Gegenteil, nämlich dass wir etwas sprechen und der Computer schreibt es dann auf, gibt es inzwischen gute Software.
Als ich das erste Mal mit Texterkennungssoftware »gespielt« habe, und mehr als Spielen konnte man es auch nicht nennen, da war das Ergebnis sehr durchwachsen. Wenn man das Programm entsprechend trainierte, das hieß, mindestens eine halbe Stunde oder länger irgendwelche Texte dem Programm vorlas, dann war es vielleicht in der Lage, wenn man sehr langsam diktierte, das gesprochene Wort zu erkennen und in einen Text umzusetzen. Meistens war jedoch der Nachbearbeitungsaufwand so groß, dass man letztlich durch das Diktat keine Zeit gewann. Es ersparte einem lediglich die Tipparbeit. Das hat sich heute weitgehend geändert.
Inzwischen haben diese Programme eine erstaunliche Entwicklung gemacht. In der Regel verstehen sie den gesprochenen Text auch dann, wenn man nicht super langsam spricht, also womöglich noch langsamer, als man schreiben könnte. Schon mit relativ wenig Training ist es möglich, dass das Programm die eigene Stimme so gut erkennen kann, dass bei einem Diktat fast keine Fehler mehr vorkommen. Ich setze hier das Programm Dragon Naturally Speaking in der Version 13 ein.
Ich bin als relativ schneller Sprecher bekannt und dennoch erkennt die Software meine Sprache sehr genau und fast ohne Fehler. Das ist umso überraschender, als gerade jetzt, während ich diesen Text diktiere, im Hintergrund noch eine Hard Rock CD läuft. Die Zeiten, in denen es mucksmäuschenstill im Raum sein musste, damit das Programm überhaupt die menschliche Stimme von einem Umgebungsgeräusch unterscheiden konnte, sind lange vorbei. Beim Diktat solcher Texte behindert höchstens noch die Frage, wann ein Komma oder ein Punkt gesetzt werden sollte, den Sprachfluss.
Eigentlich wollen diese Programme jedoch noch mehr. Sie wollen es dem Nutzer ermöglichen, seinen Computer vollständig mit der Stimme zu steuern. Das heißt, auch Befehle, um mit der Software zu arbeiten oder im Programm Veränderungen hervorzurufen, lassen sich über Dragon ausführen. Befehle wie »öffne Programm«, Fenster schließen oder Drücke F1 führt das Programm angeblich sofort aus.
Getestet habe ich dies bisher nicht, denn hier ist die Maus sicherlich noch tausendmal schneller als menschliche Sprachbefehle. Aber dennoch ist es so, dass behinderte Personen, die vielleicht nicht mehr so gut sehen können oder denen die Maussteuerung Probleme bereitet, diese Software optimal für sich einsetzen können.
Doch auch alle die, die nicht sehbehindert sind, können, sofern sie Vielschreiber sind, von dieser Software durchaus profitieren. Letztlich lässt sich so ein Text, wie dieser hier, in wenigen Minuten herunter diktieren. Wenn ihr also nicht zu den Menschen gehört, die 180 Anschläge pro Minute schaffen, dann solltet ihr auf jeden Fall mal mit dem Gedanken spielen euch so eine Software zuzulegen.
Allerdings gibt es bei der Auswahl der Spracherkennungssoftware noch einen relativ großen Haken. Die auf der Verpackung des Programms angegebenen Mindestvoraussetzungen für eine Nutzung sind auch wirklich als solche zu verstehen. Ein Intel Dual Core Prozessor mit 2 GB RAM, wie das Programm in als Mindestanforderung vorschlägt, reicht keinesfalls für flüssiges Arbeiten aus. So kommt es immer wieder zu Hängern und zur falschen Texterkennung, denn die Qualität der Texterkennung hängt in einem sehr großen Maß davon ab, wie schnell der Rechner ist.
Auf meinem Testsystem (Windows 10 Professional 64 Bit mit Intel Core i5 und 6 GB RAM) lief das Programm fehlerfrei. Auf meinem Notebook, Windows 10 Home 64 Bit mit AMD Dual-Core E450 und 6 GB RAM ist ein flüssiges Arbeiten hingegen kaum möglich.

Advertisements

Autor: Heiko Reckert

Journalist Autor Dozent in der Erwachsenenbildung

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden /  Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden /  Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden /  Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden /  Ändern )

Verbinde mit %s