Beim Blick auf die Audiotranskriptionsseite von F4 gab es kürzlich eine Ankündigung zur neuen Version 2012 – F4 Pro. Da ich selbst die nach wie vor die Version 1 – bzw. 3.1. – der Transkriptionssoftware verwende und außerordentlich zufrieden mit der Stabilität und vor allem dem Ergebnis der Version war und bin, hat mich die neue Version schon neugierig gemacht. Im Folgenden ein kurzes Review der neuen Funktionen der F4 Pro Version, die doch aufhorchen lassen und ich direkt den 30% Pre-Sale Rabatt genutzt habe.
Minimalismus der UI
Der erste Punkt, der beim Blick auf die Screenshots auffällt ist die neue Benutzeroberfläche, die das Wesentliche in den Mittelpunkt rückt: den Text. Diese Umsetzung gefällt mir nicht nur bei Webseiten gut, dass das Kernthema im Vordergrund steht, sondern auch bei Software. Es wurden alle unnötigen Bedienelemente entfernt, bzw. so dargestellt, dass sie nicht vom eigentlichen Transkript ablenken. Wirklich gelungen.
Zudem werden nun im unteren Bildschirmbereich die Wellenformen der Audiodatei angezeigt. Ein wie ich finde interessantes Features, um vorzeitig Pausen oder Gesprächsflüsse zu erkennen. Ich hoffe nur, dass die Performance hierunter nicht leidet. Leider war es bei den Nachfolge-Versionen der 3.1 so, dass es auf meinem alten Rechner mitunter zu Fehlern führte, so dass das Programm abstürzte. Aus diesem Grund verwende ich nach wie vor die 3.1.
Funktionen: SRT Export
Die für mich interessanteste Funktion ist die Möglichkeit eines SRT-Exports. Dabei handelt es sich um ein Format für Untertitel, welches unter anderem bei Youtube Videos zum Einsatz kommt (vgl. Youtube Untertitel auslesen – kopieren / Captions). Hier sehe ich persönlich eine der wichtigsten Funktionen für den Bereich Online Marketing. Denn, und nun folgt ein kleiner Exkurs, Youtube ist nach Google die zweitgrößte Suchmaschine gemessen an den täglichen Suchanfragen. Videos sind einfach zu konsumieren und sehr beliebt. Um aber noch mehr Potential aus eigens erstellen Youtube Videos zu erhalten, empfiehlt es sich das gesprochene Wort auch in Schriftform zur Verfügung zu stellen. Hierfür lassen sich zum einen Texte transkribieren, aber um ggf. auch englischsprachige Zuschauer anzusprechen, Untertitel zu verwenden. Diese Möglichkeit bietet nun auch F4 Pro.
Was steckt hinter der Transkription – Geht das nicht automatisiert? Leider könnte man annehmen, dass nach Siri & Co eine automatisierte Transkription möglich sei. Aktuell (Stand 2020) funktioniert dies für normale Gesprächsaufnahmen / Interviews / Audiodaten nicht. Sehr klar aufgesprochene Texte von einzelnen Sprechern können durch den Dragon [vgl. Dragon Naturally Speaking] bezwungen werden. Bei mehreren Sprechern, Dialekt, Störgeräuschen, Rauschen etc. muss man selbst transkribieren. Und das erfordert sehr viel Praxis – ca. 5 h je Audiostunde sollte man für eine Transkription einplanen.
Da ich selbst Videos und Audiodateien transkribiere, konnte ich hier schon einige Erfahrungen sammeln. Wobei es einen wesentlichen Unterschied zwischen einem Transkript (einer Abschrift) und von Untertiteln gibt. Ich hatte mich anfangs über den deutlichen Preisunterschied bei einer Transkription und bei Untertiteln gewundert, aber hier gilt zu beachten, dass nur eine gewisse Textmenge je Aussage eingefügt werden kann. Soll heißen, es genügt nicht einfach die Audiodatei abzutippen, sondern man muss sich Gedanken zur Segmentierung der Inhalte machen. Der Zeitaufwand einer Untertitelung ist also wesentlich höher als für eine reguläre Transkription.
Unterstützte Formate: DSS
Ein weiterer Vorteil ist die Unterstützung des DSS Formats. Eines proprietären Olympus Formats, das erstaunliche Verbreitung findet. Ich persönlich bin kein großer Freund des Formats, da man spezielle Tools benötigt, um das Ganze weiterzubearbeiten. Dass F4 Pro hier eine Lösung anbietet finde ich klasse.
Des weiteren ist nun eine kommerzielle Nutzung nur noch mit der Pro Version zulässig. Diese Entscheidung finde ich richtig, da die Software wirklich die erste Wahl ist, wenn es um die Transkription von Audioinhalten geht, und die Entwickler auch endlich etwas verdienen müssen. Alle vorangegangen Versionen waren frei verfügbar.
Soweit meine ersten Eindrücke zur neuen Version von Audiotranskription F4 2012. Hier noch die offizielle Bekanntgabe zur Version: F4 Transkript und ein kurzes Produktvideo.
Fazit zu F4 Audiotranskription
F4 ist für mich die Benchmark unter den Transkriptionsprogrammen. Die Bedienung ist denkbar einfach. Die regulierbare Sprechgeschwindigkeit ohne Verzerrung ist für jede Transkriptionskraft eigentlich gar nicht mehr wegzudenken. Selbst Schnellsprecher lassen sich damit meistern, deren Worte in Text niederzuschreiben. Rundum das Tool für die Verschriftlichung von Audio- und Videodaten.
weiterführende Beiträge zum Thema Audiotranskription
Praxisbuch Transkription – Sehr empfehlenswerte Lektüre für Einsteiger und erfahrene Nutzer
Transkriptionspreise – Die Perspektive einer Schreibkraft auf die Dumping-Preispolitik bei Transkriptionen
Youtube Video Transkription – Breaking up the Black Box
Wünsche & Optimierungsideen für die nächste Version von F4 – siehe Sidebar „Fragen & Ausführungen“
Autor: Heiko Schmieder, M. A.
Ähnliche Beiträge:
- WordPress bei All-Inkl installieren in unter 5 Minuten
Der Webhoster All-Inkl bietet einen Installer für Wordpress, mit dem man eine Seite... - Best Practises für eine Feature-Liste auf der Website
Um die Funktionen einer SaaS übersichtlich darzustellen sind Feature-Listen optimal. Hier einige Tipps...
Hey! Leider gibts die alte free Version ja kaum mehr zu finden. Hier ein Link: http://www.fb4.fh-frankfurt.de/tips/multimedia/F4_win32.exe
Die F4 Versionen standen nie frei zum Download zur Verfügung – man musste immer einen Download-Link von Audiotranskription.de anfordern.
Dennoch, auch als Nutzer der 2012er Version – die im übrigen stabil und zuverlässig läuft – wünschte ich mir manchmal trotzdem die 3.1er Version – einfach zusätzlich – zum Testen / als Zweitoption für Mitarbeiter bspw. – oder halt die 49 EUR investieren… oder als Student 11 Euro.
Nachtrag zur 2012er Version von F4
Ich arbeite nun seit einem Jahr (Stand 2013) mit der neuen Version. Mein Fazit: Man sollte definitiv die neue Version verwenden, da sie ein weitaus komfortableres Transkribieren ermöglicht. Neben der Stabilität, dem aufgeräumten Interface, ist besonders die Geschwindkeitsregelung ein klares Plus gegenüber der alten Version. Gerade bei klaren Aufnahmen lässt sich die Sprechgeschwindigkeit ohne Verzerrungen herunterdrehen, und man kann deutlich effizienter arbeiten.
Und gerade für Studenten bietet F4 besonders günstige Preise, von daher sollte man nicht endlos nach der alten Version suchen, und gleich auf die neue Version umsteigen.
Dennoch, auch die besseren Features der Transkriptionssoftware, verringern den zeitlichen Aufwand einer manuellen Abschrift / Transkription nicht immens. Wer keine Übung in der Transkription von Sprachdaten hat, der wird es auch so schwer haben, wenn er feststellt, dass er für eine Interviewstunde circa 5 Stunden+ (Anfänger werden deutlich länger brauchen) am Stück schreiben muss. Es ist und bleibt ein sehr zeit- und arbeitsintensives Verfahren Audiodaten in Schriftform zu bringen.
MfG
Heiko
Ein kurzer Nachtrag zum Thema Transkription von Gruppeninterviews / Gruppendiskussionen, da die Frage aufkam. Eine Sprecheridentifizierung im Rahmen eines Gruppengesprächs rein auf Basis von Audiomaterial ist schwierig bis nicht möglich. Dafür wären Videoaufnahmen erforderlich, um eine eindeutige Sprecherzuordnung zu gewährleisten. Ausnahme hierbei wäre, wenn die Schreibkraft die Sprecher (gut) kennt und die Stimmen aufgrund markanter Merkmale zuordnen kann. Im Rahmen einer Gruppendiskussion mit 5+ Teilnehmern ist diese eindeutige Zuordnung nicht möglich. Es sei denn alle Teilnehmer nennen vor jedem Redeanteil ihren Namen, was der eigentlichen Gruppendynamik nicht zuträglich ist.
Hi. Mal eine Frage zum Olympus Format DSS bzw. DS2. Bin gerade bei der Transkription einer solchen DS2 Datei mit F4 2012 (muss man zwar umwandeln, aber es funktioniert). Ist es normal, dass die Aufnahmen immer so ein leichtes Rauschen haben?
Klar, bei der Kompression bleibt immer einiges auf der Strecke, aber gibt es evt. eine Einstellmöglichkeit, dass die Audioaufnahmen etwas klarer werden. Ich muss ehrlich sagen, dass Aufzeichnungen mit dem iPhone um Welten besser sind. Was nützt mir eine kleine Datei, wenn man den Wortlaut dank des Kompressionsgrads nicht mehr richtig verstehen kann. Das ist wirklich ärgerlich, gerade weil ich die Erfahrung beim Olympus Format ständig mache, dass die Tonqualität einfach nur unbrauchbar ist, gerade bei Interviewsituationen die man transkribieren muss…
Hi, kann ich nur bestätigen – DSS ist zumeist qualitativ eine echte Herausforderung – man hat zwar kleine Dateien, aber versteht nach 4h transkibieren nur noch ein monotones Dahinreden, weil der Pegel / die Sprachqualität gar nicht geht. Ganz abgesehen, die Aufzeichnungen als Dritter, ohne entsprechendes Diktiergerät, nur mit Transkriptionssoftware, zu öffnen. Zum Glück gibt’s auch weniger proprietäre Formate, die per Default eine ordentliche Aufzeichnung ausgeben. Oder es liegt wirklich am Nutzer. Who know’s 🙂
MfG
Warum sind DSS Dateien in der Regel sehr schwer verständlich?
Ich erlebe es so häufig, dass ich Interviews im DSS Format erhalte, die Dateien klein und handlich, aber die Klangqualität, und damit Verständlichkeit einzelner Wortlaute bei parallelen Sprechen bspw. ist für Dritte schwer verständlich. Da ich die Dateien von Kunden erhalten, kann ich selbst nicht nachvollziehen, ob es per se am Dateiformat liegt, oder an einer Einstellung. Verstehen kann ich das Qualitätsproblem bei DSS aber nicht, da es sich um ein spezielles Format eben für diesen Zweck, für Diktate und Interviews handelt… ggf. hat jemand Tipps, wie man DSS Dateien optimieren kann / bereits bei der Aufnahme zu einem besseren Ergebnis kommt.
Bspw. für 60 Bandminuten eine nur 6 MB große (DSS) Datei zu erhalten, lässt mich vorab schon erahnen, wo die Höhen und Tiefen der Audiowellen bleiben…
MfG