Home » Transkription

Transkription

Transkription von Audio & Video

Transkription (oder Transkribieren) bedeutet, gesprochene Sprache aus Audio- oder Videodateien in schriftliche Form zu bringen.

Diese Dateien können Audiodateien wie MP3 oder WAV und Videodateien wie MP4 oder AVI sein. Häufig sind sie auf Plattformen wie YouTube oder auf Webseiten verfügbar. Auch Radiobeiträge, Fernsehsendungen und andere Medien können für die Transkription genutzt werden.

Im Folgenden finden Sie eine Reihe von Beiträgen zur Transkription auf Tikoim.de.
Stichworte: Abschrift vom Band, Interviewtranskript, Transkribieren Interviews, Manuskript, Audio als Text, Digitalisierung von Sprache…

Meta Box
Weiterführende Gedanken und Ansatzpunkte für die (zukünftige) Transkription von Sprachinhalten. [Brainstorming]

Eine Autocomplete Funktion für die Symbiose von manueller Transkriptionssoftware und Spracherkennungssoftware. Erkennung von einzelnen Begriffen während des Prozesses der manuellen Abschrift, als eine Art Autocomplete einzelner Worte.

Autocomplete Funktion für die Audiotranskription

Mittels einer intelligenten computergesteuerten Unterstützung des manuellen Abschriftprozesses kann es gelingen die Transkription von audiovisuellen Sprachinhalten deutlich effektiver zu gestalten. Neben einer integrierten Spracherkennung muss dabei der eigentliche Eingabeprozess berücksichtigt werden, und bereits während der Niederschrift einzelner Buchstaben, eine automatische Vervollständigung einzelner Worte erfolgen.

Unabhängig der Spracherkennung ist eine simple Funktion, welche in etwa ebenfalls bei Office Anwendungen zum Einsatz kommen könnte, vorstellbar, die bereits verwendete Begriffe bei der Eingabe, möglichst ohne Ablenkung beim Transkriptionsprozess, einträgt. Im konkreten Anwendungsfall der Transkription von Sprachinhalten, werden von den Gesprächsteilnehmern / Referenten häufig Begriffe, wie zum Beispiel Eigennamen oder gar eindeutige Wendungen wiederholt, welche mittels intelligenter Softwarelösungen bei der manuellen Verschriftlichung automatisiert vorgegeben oder eingefügt werden.

Audio Mining

Als Ansatzpunkte hierfür kann beispielsweise die Technologie des Audio Mining herangezogen werden. Das Zusammenspiel einer wellenbasierten Analyse der Audiodaten kann dabei unterstützen, konkret festzustellen, an welcher Stelle der Aufnahme sich die Abschrift befindet und Hilfestellung bei Eingabe leisten. Konkret können häufig wiederkehrende Begriffe dem Nutzer bei der Verschriftlichung direkt vorgeschlagen werden, bzw. direkt in den Text eingefügt werden.

Youtube ist in diesem Zusammenhang ein Vorreiter, und bietet bereits heute (2013) eine Art computergestützte Transkriptionshilfe, die beim Eingabeprozess das Abspielen der Audiodatei / des Videos stoppt, wenn der Benutzer Text eingibt. Dennoch fehlen hier zusätzliche Funktionalitäten, wie sie die Software F4 bietet, wie etwa die Einstellung der Abspielgeschwindigkeit, so dass auch schnell gesprochene Passagen besser verschriftlicht werden können.

Autor: Heiko Schmieder, M. A.